STRUCTURAT ORGANIZAREA CALCULATORULUI EDIȚIA A șasea ANDREW S TANENBAUM Vrije Universiteit Amsterdam, Țările de Jos TODD AUSTIN Universitatea din Michigan Ann Arbor, Michigan, Statele Unite PEARSON Homoii (olurnbiis Indi m ipolis Nrw Ycirk Sun Huni iste" l Ipprr Suildlc Rivci Aiiimri(L ( j|" S ii i l' iuli» Sydury I lung Kotig Sroul Siug ipotc G n|m*i I i»ky<> CLASSICS COMPUTEA SCIENCE E THAN EH BAUM, T AUSTIN ARHITECTURA CALCULATORULUI EDIȚIA A VI-A [^PPTER Moscova • Sankt Petersburg - Nijni Novgorod - Voronezh Novosibirsk - Rostov-pe-Don - Ekaterinburg - Samara Kiev • Harkov - Minsk bk - UDC T Ѳ Tanenbaum E , Austin T T Arhitectura computerului a -a ed - Sankt Petersburg: Peter, - p : ill ISBN - - - - Cartea lui Andrew Tanenbaum, un specialist, scriitor și profesor de renume mondial în tehnologia informației, este deja la a șasea ediție și este dedicată organizării structurale a unui computer Se bazează pe ideea unei structuri ierarhice, în care fiecare nivel are o funcție bine definită În cadrul acestei abordări neconvenționale, nivelul de logică digitală, nivelul arhitecturii de instrucțiuni, nivelul sistemului de operare și nivelul limbajului de asamblare sunt descrise în detaliu A șasea ediție conține numeroase modificări pentru a aduce cartea în concordanță cu dezvoltarea rapidă a industriei computerelor În special, informațiile au fost actualizate cu privire la mașinile prezentate ca exemple: Intel Core I , Texas Instrument OMAP și Atmel ATmegal Cartea este destinată unei game largi de cititori: atât studenților care studiază tehnologia computerelor, cât și celor care se familiarizează în mod independent cu arhitectura computerelor + (În conformitate cu Legea federală din decembrie nr -FZ ) BBK - UDC Drepturi de publicare obținute în baza unui acord cu Prentice Hali, Inc Râul Upper Saddle New Jersey Toate drepturile rezervate Nicio parte a acestei cărți nu poate fi reprodusă sub nicio formă fără permisiunea scrisă a deținătorilor drepturilor de autor Informațiile conținute în această carte au fost obținute din surse considerate de către editor a fi de încredere Totuși, având în vedere eventualele erori umane sau tehnice, editorul nu poate garanta acuratețea și caracterul complet al informațiilor furnizate și nu este responsabil pentru eventualele erori asociate cu utilizarea cărții ISBN - ISBN - - - - Copyright © Prentice Hali © Traducere în rusă Editura LLC „Peter”, © Publicație în limba rusă, proiectat de Editura Piter LLC, Cuprins scurt Cuvânt înainte Capitolul Introducere Capitolul Organizarea sistemelor informatice Capitolul Nivelul logic digital Capitolul Nivelul de microarhitectură Capitolul Stratul de arhitectură al setului de instrucțiuni Capitolul Nivelul sistemului de operare Capitolul Nivelul de asamblare Capitolul Capitolul Anexa A Numere binare Anexa B Numere în virgulă mobilă Anexa B Programare în limbaj de asamblare Index alfabetic Cuprins Cuvânt înainte De la editorul traducerii Capitolul Introducere Organizarea calculatoarelor pe mai multe niveluri Limbi, niveluri și mașini virtuale Mașini moderne cu mai multe niveluri Dezvoltarea maşinilor cu mai multe niveluri Dezvoltarea arhitecturii calculatoarelor Generație zero - calculatoare mecanice ( - ) Prima generație - tuburi vid ( - ) A doua generație - tranzistoare ( - ) A treia generație - circuite integrate ( - ) A patra generație – circuite integrate foarte mari ( -?) A cincea generație - calculatoare cu putere redusă şi calculatoare invizibile Tipuri de computere Aspecte tehnologice şi economice O gamă largă de calculatoare Calculatoare de unică folosință Microcontrolere Calculatoare mobile și pentru jocuri Calculatoare personale Servere Clustere Mainframe Familii de calculatoare Introducere în arhitectura x Introducere în Arhitectura ARM Introducere în Arhitectura AVR Unități Rezumatul cărții Întrebări și sarcini Capitolul Organizarea sistemelor informatice Procesoare Unitate CPU Executarea comenzilor Sisteme RISC și CISC Principii de proiectare pentru calculatoare moderne Paralelism la nivel de instruire Paralelism la nivel de procesor Memoria principala Pic Adrese de memorie Ordinea octetilor Cod de corectare a erorilor Cache Asamblarea modulelor de memorie și tipurile acestora Memoria auxiliară Structura ierarhică a memoriei Discuri magnetice : Yue-discuri Discuri SCSI Matrice RAID Unităţi cu stare solidă CD-ROM-uri Discuri CD-R Discuri CD-RW Discuri DVD Discuri Blu-Ray Intrare Ieșire Anvelope Magistralele PCI și PCIe Terminale Memorie video Șoareci Controlere de joc Imprimante Echipamente de telecomunicaţii Camere digitale Codurile de caractere Rezumatul capitolului Întrebări și teme Capitolul Nivelul logic digital Porțile și algebra booleană Supape Algebră booleană Implementarea funcţiilor booleene Echivalența schemei Cuprins Circuite logice digitale de bază Circuite integrate Scheme combinatorii Scheme aritmetice Generatoare de ceas Memorie Încuietori Declanșatoare Registre Organizarea memoriei Chip-uri de memorie RAM și ROM FPGA Circuite integrate și magistrale ale procesorului CI-uri de procesor Anvelope pentru calculator Latimea anvelopei Timp autobuz Arbitraj autobuz Principiile autobuzului Exemple de procesoare Intel Core i Sistem cu un singur cip Texas Instruments OMAR Microcontroler Atmel ATmegal Exemple de anvelope magistrală PCI PCI Express Autobuz USB Interfețe Interfețe I/O Decodificarea adresei Rezumatul capitolului Întrebări și teme Capitolul Nivelul de microarhitectură Exemplu de microarhitectură Calea datelor Microinstrucțiuni Managementul microinstructiunilor - Microarhitectura Mic- Exemplu de arhitectură de set de instrucțiuni - IJVM Stoc Model de memorie IJVM Set de comenzi IJVM Compilarea IJVM Exemplu de implementare a microarhitecturii Micro-instrucțiuni și înregistrarea acestora Implementarea IJVM folosind microarhitectura Mic- Proiectarea nivelului de microarhitectură Viteză și cost Scurtarea lungimii căii Preluare memorie - microarhitectura Міс- Proiectare transportoare - microarhitectura Mіs- Transportor în șapte trepte - microarhitectură Mis- Îmbunătățirea performanței Memoria cache : Predicția tranziției Executarea secvenței și înlocuirea registrelor Execuția speculativă Exemple de nivel de microarhitectură Microarhitectura procesorului Core i Microarhitectura Omap Privire de ansamblu asupra microarhitecturii Cortex A Microarhitectura microcontrolerului ATmegal Comparația procesoarelor i , OMAR și ATmegal Rezumatul capitolului Întrebări și teme Capitolul Stratul de arhitectură al setului de instrucțiuni Prezentare generală a stratului de arhitectură al setului de instrucțiuni Proprietăţile nivelului arhitecturii setului de instrucţiuni Modele de memorie Registre Echipe Prezentare generală a nivelului de arhitectură al setului de instrucțiuni COGE i Prezentare generală a nivelului arhitecturii setului de instrucțiuni OMAP Prezentare generală la nivel de arhitectură a setului de instrucțiuni ATmegal Tipuri de date Tipuri de date numerice Tipuri de date non-numerice Tipuri de date ale procesorului Coré i Tipuri de date mașină OMAP Tipuri de date ATmegal continuturi Formate de comenzi Criterii de proiectare a formatului de comandă Extensie opcode Formate de comandă ale procesorului Core i Formate de comandă ale procesorului OMAP Formate de comandă ATmegal Adresarea Moduri de adresare Adresare directă Adresare directă Adresa înregistrată Înregistrare Adresare Indirectă Adresarea indexului Adresarea indexului relativ Adresarea stivei Moduri de adresare în instrucțiunile de salt Ortogonalitatea codurilor operaționale și a modurilor de adresare Moduri de adresare ale procesorului Core i Moduri de adresare ale procesorului OMAP Moduri de adresare a procesorului ATmegal Compararea modurilor de adresare Tipuri de comenzi Comenzi de mișcare a datelor Operaţii binare Operaţii unare Comparaţii şi sărituri condiţionate Comenzi de apel de procedură Managementul ciclului Comenzi I/O Comenzi procesor COGE i Comenzi OMAP Comenzi ATmegal Comparare seturi de comenzi Flux de control Fluxul de control secvențial și tranzițiile Proceduri Coroutine Captarea excepțiilor Întreruperi Turnul din Hanoi Rezolvarea problemei „Turnul din Hanoi” în asamblatorul Coge і Rezolvarea problemei „Turnul din Hanoi” în asamblatorul OMAR IA- Arhitectură și procesor Itanium Problema IA- Model IA- - calcule cu paralelism explicit de instrucțiuni Reducerea numărului de accesări la memorie Programarea echipei Reducerea numărului de sărituri condiționate - predicție Încărcare speculativă Rezumatul capitolului Întrebări și sarcini Capitolul Nivelul sistemului de operare Memorie virtuală Paginare în memorie Implementarea Memory Paging Apelarea paginilor la cerere și a setului de lucru Politica de înlocuire a paginii Dimensiunea paginii și fragmentarea Segmentare Implementarea Segmentării Memoria virtuală Coge I OMAP Memorie virtuală Memorie virtuală și cache Virtualizare hardware Virtualizarea hardware în COG i Instrucțiuni I/O virtuale Fișiere Implementarea comenzilor I/O virtuale Comenzi de gestionare a directorului Instrucțiuni virtuale pentru funcționarea în paralel Modelarea procesului Starea cursei Sincronizarea unui proces folosind semafoare Exemple de sisteme de operare Introducere în sistemele de operare UNIX și Windows XP Exemple de memorie virtuală Exemple de I/O virtuale Exemple de control al proceselor Rezumatul capitolului Întrebări și teme Capitolul Nivelul de asamblare Introducere în asamblare Ce este „limbajul de asamblare”? Cuprins Încadrarea asamblatorului * Formatul instrucţiunilor în asamblator Directive Macrocomenzi Definiție macro, apel macro și extindere macro Macro-uri cu parametri Caracteristici suplimentare Implementarea macrocomenzilor în asamblator Proces de asamblare Asamblarea în două treceri Prima trecere A doua trecere Tabel de nume simbolice Conectare și descărcare Sarcini de linker Structura modulului obiect Timpul de legătură și realocarea dinamică a memoriei Legătura dinamică Rezumatul capitolului Întrebări și sarcini Capitolul Arhitecturi de calculatoare paralele Paralelism intra-CPU Paralelism la nivel de instruire Multithreading intraprocesor Multiprocesoare cu un singur cip Coprocesoare Procesoare de rețea GPU-uri GPU NVIDIA Fermi Criptoprocesoare Multiprocesoare Multiprocesoare și multicalculatoare Semantica memoriei IMA-multiprocesoare simetrice arhitecturi multiprocesor certuri multiprocesor NUMA certuri cu multiprocesor SOMA Multicalculatoare Reţele de comunicaţii Procesoare masiv paralele Cluster Computing Software de comunicare pentru multicalculatoare Planificare Memorie partajată la nivelul aplicației Productivitate Calcul distribuit Rezumatul capitolului Întrebări și sarcini Capitolul Bibliografie Anexa A Numere binare Numere de precizie finită Sisteme numerice poziționale Conversia numerelor dintr-un sistem numeric în altul Numere binare negative Aritmetică binară Întrebări și sarcini Anexa B Numere în virgulă mobilă Principii de reprezentare a numerelor în virgulă mobilă Standardul IEEE Întrebări și teme Anexa B Programarea în limbaj de asamblare Concepte de bază Limbajul de asamblare Un mic program în limbaj de asamblare Procesor Ciclul procesorului Registre de uz general Registre pointer Memorie și adresare Organizarea memoriei și segmentele Adresare Setul de comenzi Mutarea, copierea și comenzile aritmetice Operații booleene, pe biți și de deplasare Operații în buclă și recurente operații cu șiruri Instrucțiuni de săriți și apeluri Apeluri subrutine Apeluri de sistem și subrutine de sistem Observații finale asupra setului de instrucțiuni Asamblator Introducere Asambler As din setul ACK Câteva diferențe față de alți asamblori Tracer Comenzi Tracer Etape pregătitoare Exemple Bună lume Registre de uz general Apelarea instrucțiunilor și a registrelor pointerului Depanarea unui program de ieșire matrice Prelucrarea șirurilor de caractere și comenzile șirurilor Tabele de expediere Acces în buffer și aleatoriu la fișiere Întrebări și teme Index E Tanenbaum (AST): Către Suzanne, Barbara, Marvin, Aaron și N T Austin (TA): Roberta, care mi-a oferit spațiul (și timpul) pentru a finaliza acest proiect cuvânt înainte Primele cinci ediții ale cărții se bazează pe ideea că computerul poate fi privit ca o ierarhie de niveluri, fiecare dintre ele îndeplinește o funcție specifică Această afirmație fundamentală este la fel de valabilă acum ca și atunci când a fost publicată prima ediție, așa că voi continua să o iau ca bază, de data aceasta în cea de-a șasea ediție La fel ca primele cinci, acesta detaliază nivelul logicii digitale, precum și microarhitectura, arhitectura setului de instrucțiuni, sistemul de operare și nivelurile de asamblare Structura de ansamblu a cărții a rămas aceeași, dar au fost aduse numeroase modificări la cea de-a șasea ediție pentru a o alinia cu dezvoltarea rapidă a industriei computerelor În special, mașinile prezentate ca exemple au fost actualizate Această ediție acoperă Intel Core i , Texas Instrument OMAP și Atmel ATmegal Core I este un procesor popular folosit în laptopuri, desktop-uri și servere OMAP este un procesor popular bazat pe ARM utilizat pe scară largă în smartphone-uri și tablete Cel mai probabil, nu ați auzit niciodată de microcontrolerul ATmegal , dar ați interacționat cu el de multe ori Microcontrolerul ATmegal bazat pe AVR se găsește în multe sisteme încorporate, de la radio cu ceas până la cuptoare cu microunde Interesul pentru sistemele încorporate este în creștere, iar ATmegal este utilizat pe scară largă datorită costului său excepțional de scăzut, a selecției largi de software și periferice și a abundenței de programatori calificați Desigur, în ceea ce privește numărul de copii instalate în lume, ATmegal este cu ordine de mărime înaintea procesoarelor Pentium și Coge i , i și i ATmegal este instalat în computerul încorporat cu o singură placă Arduino, un sistem popular pentru entuziaști care a fost proiectat de o universitate italiană pentru a fi mai ieftin decât un prânz la o pizzerie Mulți profesori care își construiesc cursurile în jurul acestei cărți mi-au cerut să dezvolt subiectul programarii în limbaj de asamblare În cea de-a șasea ediție, acest material a fost plasat pe site-ul cărții (vezi mai jos), unde poate fi ușor completat și ținut la zi Exemplele folosesc asamblatorul , care este o versiune simplificată a setului de instrucțiuni iA incredibil de popular folosit de procesorul Coge i S-ar putea alege ARM sau AVR sau o altă arhitectură de set de instrucțiuni de care puțini oameni au auzit, dar are un avantaj important - majoritatea studenților lucrează acasă pe sisteme compatibile cu Setul complet de comenzi COGE i este prea complex pentru ca studenții să-l studieze în detaliu Setul de instrucțiuni este similar, dar mult mai simplu În plus, procesorul COGE I detaliat în această ediție a cărții este capabil să ruleze de programe cuvânt înainte pentru a ajuta în procesul de învățare a limbajului de asamblare, inclusiv asamblatorul în sine, precum și simulatorul și trasorul Aceste instrumente funcționează pe medii Windows, UNIX și Linux Sunt disponibile pe site-ul cărții De-a lungul anilor, cartea a crescut în volum (în prima ediție au fost de pagini; în a treia ediție sunt deja ) Acest lucru este inevitabil deoarece există o dezvoltare constantă și se știe din ce în ce mai mult despre subiect Prin urmare, dacă cartea este utilizată în scopuri didactice, trebuie avut în vedere că este posibil să nu fie posibilă finalizarea materialului în cadrul cursului de formare (de exemplu, în sistemul trimestrial) O posibilă opțiune este să studiați primele trei capitole, parte a capitolului (până la și inclusiv secțiunea ) și capitolul ca minim și să petreceți timpul rămas la discreția dvs pentru a-l petrece restul capitolului , precum și părți din capitolele , și , în funcție de interesele profesorului și studenților Mai jos este un rezumat al modificărilor majore pe capitole (relativ cu ediția a cincea) Capitolul continuă să prezinte istoria arhitecturii computerelor, explicând stadiul actual al tehnicii și trece în revistă principalele repere de-a lungul drumului Va fi probabil o surpriză pentru mulți studenți că cele mai puternice computere din anii , care au costat milioane de dolari, nu câștigă nici măcar un procent din smartphone-urile lor în ceea ce privește puterea de procesare Este discutată o gamă extinsă de computere existente, inclusiv FPGA, smartphone-uri, tablete și console de jocuri Iată arhitecturile alese ca exemplu (Core i , OMAP și ATmegal ) Materialul din capitolul a fost actualizat și revizuit Include procesoare pentru procesarea paralelă a datelor, inclusiv unități de procesare grafică (GPU) Secțiunea despre mediile de stocare a fost actualizată cu descrieri ale dispozitivelor flash, care devin din ce în ce mai populare A fost adăugat material nou la secțiunea I/O privind controlerele de jocuri moderne, inclusiv Wiimote și Kinect, precum și ecranele tactile utilizate în smartphone-uri și tablete Capitolul a suferit câteva modificări Ca și înainte, se deschide cu o descriere a principiului de funcționare a tranzistorilor, astfel încât principiul de funcționare a unui computer modern este clar chiar și pentru un student care nu are idee despre hardware Prezentăm material nou despre Field-Programmable Gate Arrays (FPGA) - dispozitive care reduc costurile arhitecturilor la scară largă la nivel de poartă până la punctul în care sunt utilizate pe scară largă în sălile de clasă De asemenea, aici sunt descrieri la nivel înalt a trei arhitecturi pe care le-am ales ca exemplu Capitolul , care conturează principiile de bază ale sistemelor de calcul, a rămas aproape neschimbat de la lansarea celei de-a cincea ediții Include doar trei noi secțiuni dedicate nivelului de microarhitectură a procesoarelor COGE , OMAP și ATmegal Capitolele și au fost actualizate pentru noi arhitecturi; în special, au apărut noi secțiuni cu descrieri ale setului de instrucțiuni ARM și AVR În capitolul , în loc de Windows XP, materialul este explicat folosind exemplul Windows Capitolul , dedicat asamblatorului, a rămas practic neschimbat Cuvânt înainte Capitolul , dimpotrivă, a fost complet rescris, iar acum reflectă în mod adecvat dezvoltarea arhitecturilor de computere paralele Include informații suplimentare despre arhitectura multiprocesorului Cori I și o descriere detaliată a arhitecturii GPU de uz general NVIDIA Fermi În cele din urmă, secțiunile despre supercomputerele BlueGene și Red Storm au fost actualizate cu cele mai recente actualizări ale acestor mașini gigantice Capitolul s-a schimbat Bibliografia a fost mutată pe site, astfel încât în capitol rămân doar referințele menționate în carte Mulți dintre ei nu au fost în edițiile anterioare ale cărții Acest lucru este destul de natural; arhitectura calculatoarelor - domeniul arhitecturilor calculatoarelor se dezvoltă dinamic Aplicațiile A și B nu s-au schimbat și pe bună dreptate - nu au existat revoluții în domeniul numerelor binare și hexazecimale în ultimii ani Anexa B, despre programarea în limbaj de asamblare, a fost scris de Evert Wattel de la Universitatea Liberă din Amsterdam Are multă experiență în a învăța să lucreze cu instrumente de programare în limbaj de asamblare și îi sunt foarte recunoscător pentru că și-a asumat această sarcină Conținutul anexei s-a schimbat puțin de la lansarea celei de-a cincea ediții, dar instrumentele software sunt acum găzduite pe site, mai degrabă decât pe CD-ul însoțitor Pe lângă instrumentele de asamblare, site-ul are un program de simulare (un simulator grafic) conceput să lucreze cu materialul din capitolul , dezvoltat de profesorul Richard Salter de la Oberlin College Lui - mulțumiri speciale Programul îi va ajuta pe elevi să înțeleagă mai bine principiile prezentate în acest capitol Site-ul cărții cu programe și totul se află la: http://www pearsonhighered com/tanenbaum După ce ați accesat adresa specificată, faceți clic pe linkul Companion Website și selectați pagina dorită din meniul care apare Categoria de resurse pentru studenți include: + Asamblator/Tracer - Simulator grafic + Referințe Resursele pentru educatori includ: + Prezentări PowerPoint + Rezolvari ale exercitiilor date la sfarsitul capitolelor Este necesară o parolă pentru a accesa resursele didactice Educatorii trebuie să contacteze un reprezentant Pearson Education pentru a obține unul Mulți oameni au citit (părți din) manuscrisele acestei cărți și au oferit comentarii valoroase, sugestii sau alt ajutor În special, dorim să mulțumim Annei Austin (Appa Austin), Mark Austin, Livio Bertacco, Valeria Bertacco (Vaegia Bcrtacco), Debapriya Chatterjee, Jason Clemons, Andrew DeOrio, Joseph Grcathouse și Andrea Pellegrini De la editorul traducerii nouăsprezece Următoarele persoane au citit manuscrisul și au sugerat modificări: Jason D Bakos (Universitatea din Carolina de Sud), Bob Brown (Universitatea de Stat Politehnică de Sud), Andrew Chen (Universitatea de Stat din Minnesota (Moorhead), J J Archer Harris - Universitatea James Madison , Susan Krucke - Universitatea James Madison, A Yavuz Ogne - Universitatea din Maryland, Frances Marsh - Colegiul Comunitar Jamestown și Chris Schindler (Kris Schindler) este o universitate din Buffalo Va multumesc tuturor Am avut și asistenți care au participat la crearea de noi exerciții Aceștia sunt Byron A Jeff (Vugop A Jeff) - Clayton University, Laura W McFall - DePaul University, Taghi M Mostafavi - University of North Carolina at Charlotte și James Nigtrom (James Nystrom este University of Ferris De asemenea, le suntem foarte recunoscători pentru ajutorul acordat Editorul nostru, Tracey Johnson, a fost extrem de util în multe privințe și a arătat, de asemenea, o mare răbdare Apreciem foarte mult munca lui Carol Snyder (Carol Snyder) în coordonarea activității participanților la proiect Bob Englehardt a făcut o treabă grozavă organizând procesul de producție Eu (AST) aș dori să îi mulțumesc lui Suzanne pentru dragostea și răbdarea ei Aceasta este a -a carte și suntem încă împreună! Mulțumesc Barbara și Marvin pentru că sunt copii atât de grozavi - acum știu ce fac profesorii pentru a-și câștiga existența Aaron aparține generației următoare: copiii zgi încep să lucreze la computer chiar înainte de a merge la grădiniță Sunt încă prea mic pentru asta, dar după ce va învăța să meargă, iPad-ul va fi următorul la rând În cele din urmă, vreau să îi mulțumesc soacrei mele, Robertei, care m-a ajutat să profit la maximum de timpul meu cu această carte Sufrageria ei din Bassano Del Grippa (Italia) a oferit atât adăpost, singurătate și vin cât era necesar pentru această sarcină importantă Andrew Tanenbaum Todd Austin De la editorul traducerii Vă rugăm să trimiteți comentariile, sugestiile și întrebările dvs la comp@piter com (editura Peter, ediție computer) Ne-am bucura sa primim vesti de la tine! Informații detaliate despre cărțile noastre pot fi găsite pe site-ul editurii http://www piter com Capitolul Introducere Un computer digital este o mașină care poate rezolva probleme executând comenzile care îi sunt date O secvență de comenzi care descriu soluția unei anumite probleme se numește program Circuitele electronice ale fiecărui computer pot recunoaște și executa un set limitat de comenzi simple Toate programele înainte de execuție trebuie transformate într-o secvență de astfel de instrucțiuni, care de obicei nu sunt mai complicate decât, de exemplu: + adăugați două numere; + verificați dacă numărul nu este zero; + copiați un bloc de date dintr-o parte a memoriei computerului în alta Aceste comenzi primitive constituie colectiv limbajul în care oamenii pot comunica cu un computer Un astfel de limbaj se numește limbaj mașină Proiectantul, atunci când creează un nou computer, trebuie să decidă ce comenzi să includă în limbajul mașinii acelui computer Depinde de scopul computerului și de sarcinile pe care trebuie să le rezolve Este obișnuit să încercați să faceți instrucțiunile mașinii cât mai simple posibil pentru a evita complexitatea proiectării computerului și pentru a reduce costul electronicelor necesare Majoritatea limbajelor de mașină sunt extrem de primitive, ceea ce face scrierea în ele atât dificilă, cât și plictisitoare ?) Acea simplă observație de-a lungul timpului a dus la construirea unui număr de niveluri de abstractizare, fiecare dintre ele construit pe deasupra unui nivel inferior de abstractizare În acest fel, complexitățile pot fi depășite și procesul de proiectare devine sistematic și organizat Numim această abordare organizare computerizată pe mai multe niveluri În secțiunea următoare, vom explica ce înseamnă acest termen Apoi vom vorbi despre istoria dezvoltării problemei și starea actuală a lucrurilor, precum și să luăm în considerare câteva exemple importante Organizarea calculatoarelor pe mai multe niveluri După cum am spus deja, există o diferență uriașă între ceea ce este convenabil pentru oameni și ceea ce pot face computerele Oamenii vor să facă X, dar computerele pot face doar Y Acest lucru creează o problemă Scopul acestei cărți este de a explica cum se rezolvă această problemă Limbi, niveluri și mașini virtuale Problema de mai sus poate fi rezolvată în două moduri Ambele metode implică dezvoltarea de noi instrucțiuni care sunt mai prietenoase cu oamenii decât instrucțiunile încorporate ale mașinii Aceste noi comenzi formează în mod colectiv limbajul kiniry vom numi R Instrucțiunile mașinii încorporate formează, de asemenea, limbajul și îl vom numi CL Un computer poate executa numai programe scrise în limbajul său de mașină DL Cele două moduri de rezolvare a pro-Gniema diferă prin modul în care computerul va executa programe care sunt scrise în L , deoarece, în final, doar limbajul mașină LO este disponibil pentru computer Prima modalitate de a executa un program scris în L este înlocuirea fiecărei instrucțiuni cu un set echivalent de instrucțiuni LAO În al doilea caz, computerul execută un nou program scris în DL în locul containerului programului scris în IL Această tehnologie se numește traducere A doua modalitate este de a crea un program în limbajul DL, care primește ca intrare programe scrise în limbajul IL În acest caz, fiecare comandă a limbajului L este procesată una câte una, după care se execută imediat setul de comenzi din limbajul LAO care este echivalent cu acesta Această tehnologie nu necesită un nou program pentru arme nucleare Se numește interpretare, iar programul care realizează interpretarea se numește interpret Există multe asemănări între traducere și interpretare În ambele cazuri, computerul ajunge să execute un set de instrucțiuni DL echivalente cu instrucțiuni IL Singura diferență este că în timpul traducerii, întregul program L este transferat în programul LAO, programul L este aruncat, iar noul program LL este încărcat în memoria computerului și apoi executat În timpul execuției, programul DL generat controlează funcționarea computerului Când este interpretată, fiecare comandă a programului L este recodificată în L și imediat executată Programul tradus nu este creat Funcționarea calculatorului este controlată de interpret, pentru care programul este în R r І'(' cel mai adevărat computer RISC de acolo, depășind cu mult toate celelalte în ceea ce privește performanța) PC Cu toate acestea, succesul comercial al acestui model a fost foarte modest - doar un deceniu mai târziu, mașinile pe de biți au câștigat popularitate și apoi doar ca servere de înaltă performanță În anii , sistemele informatice au fost accelerate prin diverse optimizări ale micro-arhitecturii, dintre care multe vor fi discutate în această carte Utilizatorii unor astfel de sisteme erau într-o dispoziție bună, deoarece cu fiecare sistem nou achiziționat, programele lor rulau mult mai repede decât în cel vechi Până la sfârșitul anilor , totuși, tendința de viteză a început să scadă din cauza a două obstacole majore de proiectare: arhitecții au rămas fără spațiu pentru a accelera programele, iar răcirea procesorului a devenit prea costisitoare Multe companii de calculatoare, disperate să construiască procesoare mai rapide, au apelat la arhitecturi paralele ca o modalitate de a extrage mai multă performanță din electronica lor În , IBM a introdus arhitectura POWER dual-core, prima unitate centrală de procesare de mare volum care includea două procesoare pe un singur substrat În zilele noastre, majoritatea procesoarelor desktop și server, și chiar unele procesoare încorporate, sunt formate din mai multe procesoare Din păcate, pentru consumatorul mediu, performanța unor astfel de multiprocesoare a fost destul de modestă, deoarece (cum vom vedea în capitolele următoare) pentru funcționarea eficientă a mașinilor paralele, programatorul trebuie să organizeze în mod explicit execuția paralelă a programelor, iar această sarcină este dificil și predispus la erori A cincea generație - calculatoare de putere mică și computere invizibile În , guvernul japonez și-a anunțat intenția de a aloca de milioane de dolari companiilor naționale pentru a dezvolta computere de generația a cincea bazate pe tehnologii de inteligență artificială, care trebuiau să înlocuiască mașinile „ascultătoare” din generația a patra Urmărind companiile japoneze capturarea rapidă a pozițiilor de pe piață în industrii, de la camere la aparate stereo la televizoare, producătorii americani și europeni s-au grăbit să solicite guvernelor lor subvenții similare și alt sprijin Cu toate acestea, în ciuda zgomotului mare, proiectul japonez de a dezvolta computere de generația a cincea s-a dovedit în cele din urmă a fi insuportabil și a fost eliminat în liniște Într-un fel, această situație s-a dovedit a fi apropiată de cea cu care s-a confruntat Babbage - ideea era atât de înaintea timpului său încât nu exista o bază tehnologică adecvată pentru implementarea ei Cu toate acestea, ceea ce poate fi numit a cincea generație de computere s-a materializat, dar într-o formă foarte neașteptată - computerele au început să scadă rapid În , Grid Systems a lansat prima tabletă numită GridPad Era echipat cu un mic ecran pe care utilizatorul putea scrie cu un stilou special Sisteme precum GridPad au demonstrat că computerul nu trebuie să fie pe un birou sau într-o cameră de server - utilizatorul îl poate transporta în jur, iar cu un ecran tactil și recunoașterea scrisului de mână, devine și mai convenabil Apple Newton, introdus în , a dovedit că un computer poate încăpea într-o carcasă de dimensiunea unui casetofon La fel ca GridPad, Newton a folosit scrisul de mână, care la început a fost un mare obstacol în calea succesului Dar, ulterior, interfața de utilizator a unor astfel de mașini, care acum se numesc asistenți electronici personali (Personal Digital Assistants, PDA), sau pur și simplu computere portabile, a fost îmbunătățită și a câștigat o mare popularitate Astăzi, smartphone-urile au devenit următoarea etapă în evoluția lor Interfața de scriere de mână a PDA a fost îmbunătățită de Jeff Hawkins, care a fondat Palm pentru a dezvolta computere portabile de afaceri pentru consumatorii de masă Hawkins a fost inginer electrician de pregătire, dar a avut un interes puternic pentru neuroștiință (știința creierului uman) El și-a dat seama că, pentru a îmbunătăți fiabilitatea scrisului de mână, ar putea învăța utilizatorilor tehnici care au făcut ca computerul să accepte mai ușor intrarea - o tehnologie numită „Graffiti” necesita o scurtă pregătire a utilizatorului, dar în cele din urmă a crescut viteza și fiabilitatea intrării Primul computer portabil al lui Palm, Palm Pilot, a fost un succes uriaș, iar Graffiti, una dintre cele mai mari realizări în domeniul calculului, a demonstrat în mod convingător capacitatea minții umane de a valorifica puterea minții umane Utilizatorii PDA își adorau dispozitivele, folosindu-le cu sârguință pentru a-și gestiona programele și contactele În anii telefoanele mobile și au fost răspândite pe scară largă Compania IBM a construit un telefon mobil de litri, creând așa-numitul „smartphone” Smartphone-ul deranjant care a fost numit Simon a folosit un ecran tactil pentru introducere și a oferit utilizatorului toată puterea unui PDA, plus un telefon, jocuri și e-mail Reducerea dimensiunii și costului componentelor în hanul final a dus la distribuția masivă a smartphone-urilor Acum cele mai populare platforme sunt Apple iPhone și Google Android Dar nici computerele de buzunar nu au devenit o dezvoltare cu adevărat revoluționară Se acordă mult mai multă importanță așa-numitelor computere „invizibile” - cele care sunt încorporate în aparatele de uz casnic, ceasuri, carduri bancare* și un număr imens de alte dispozitive [Bechini et al , ] Procesoarele de acest tip oferă o gamă largă de funcționalități și o gamă mai mică de aplicații la un preț foarte rezonabil Întrebarea lui Ion dacă aceste cipuri pot fi reunite într-o singură generație cu drepturi depline (există din anii ) rămâne deschisă Faptul este că extind capacitățile a mii de dispozitive de uz casnic și alte dispozitive cu un ordin de mărime Chiar și acum, influența computerelor invizibile asupra dezvoltării industriei mondiale este mare, iar de-a lungul anilor va crește O caracteristică a acestor tipuri de computere este că hardware-ul și software-ul lor sunt adesea proiectate într-un mod colaborativ [Henkel et al , ], despre care vom discuta mai târziu în această carte Deci, prima generație include computere pe amplificatoare electronice (cum ar fi ENIAC), a doua - mașini cu tranzistori (IBM ), iregium - primele computere pe circuite integrate (IBM ), a patra - computere personale (linii CPU Intel) În ceea ce privește a cincea generație, aceasta este mai mult asociată nu cu o arhitectură specifică, ci cu o paradigmă semnificativă Calculatoarele viitorului vor fi încorporate în toate dispozitivele imaginabile și de neconceput și datorită acestui fapt vor deveni cu adevărat invizibile ііi vor deveni o parte a vieții de zi cu zi — vor deschide uși, vor porni /і іііy, vor distribui bani și vor îndeplini mii de alte sarcini Acest model, dezvoltat de Mark Weiser în ultimii săi ani, a fost inițial numit computerizare omniprezentă, dar termenul de computerizare pervasivă nu este mai puțin comun astăzi [Weiser, ] Acest fenomen promite să schimbe lumea nu mai puțin radical decât revoluția industrială Nu ne vom opri în detaliu asupra acestei probleme, dar dacă sunteți interesat, puteți consulta literatura suplimentară [Lyytinen și Yoo, ; Saha și Mukherjee, ; Sakamura, ] Tipuri de computere În secțiunea anterioară, am schițat pe scurt istoria sistemelor informatice În această secțiune, vom descrie starea de fapt în acest moment și vom face câteva ipoteze pentru viitor În timp ce computerele personale sunt cele mai cunoscute tipuri de mașini inteligente, există și alte tipuri de mașini în zilele noastre, așa că merită să le descriem pe scurt B Capitolul Introducere Aspecte tehnologice și economice În ceea ce privește ritmul de dezvoltare, industria computerelor este înaintea tuturor celorlalte industrii Principala forță motrice este capacitatea producătorilor de a pune din ce în ce mai mulți tranzistori pe un cip în fiecare an Mai mulți tranzistori (întrerupătoare electronice minuscule) înseamnă mai multă memorie și procesoare mai puternice Gordon Moore, unul dintre fondatorii și fostul președinte al consiliului de administrație al Intel, a glumit odată că, dacă tehnologia aviației s-ar dezvolta în același ritm ca tehnologia computerelor, avioanele ar costa de dolari și ar face o tură de pământ în de minute timp de de minute combustibil Adevărat, pentru aceasta trebuie să devină dimensiunea unei cutii de pantofi El a formulat și legea progresului tehnologic, cunoscută acum drept legea lui Moore Când Gordon pregătea un raport pentru unul dintre grupurile din industrie, a observat că fiecare nouă generație de microcircuite apare la trei ani după cea anterioară Deoarece fiecare nouă generație de computere avea de ori mai multă memorie decât cea anterioară, a devenit clar că numărul de tranzistori de pe un cip a crescut într-o proporție constantă și, astfel, această creștere putea fi prezisă pentru anii următori Legea lui Moore este adesea prezentată într-o formulare care spune că numărul de tranzistori de pe un singur cip se dublează la fiecare luni, adică crește cu % în fiecare an Dimensiunile așchiilor și datele de producție confirmă faptul că legea lui Moore este încă valabilă (Fig ) G- G- § G" Aproximativ de milioane - S UM - sunt - K -® Marea Britanie - eu K - - - - Anul emiterii Orez Legea lui Moore prezice că numărul de tranzistori de pe un singur cip crește cu % în fiecare an Punctele de pe grafic sunt cantitatea de memorie în biți În general, legea lui Moore nu este deloc o lege, ci o simplă observație empirică a vitezei cu care fizicienii și inginerii de procese dezvoltă tehnologii informatice și o predicție că vor continua să lucreze cu această viteză în viitor Mulți experți cred că legea lui Moore va fi valabil încă zece ani și, eventual, mai mult Alții prevăd că dezvoltatorii se vor confrunta cu disiparea energiei, scurgeri de energie și alte probleme care vor trebui rezolvate într-un fel | Bose, FMM Kish şi colab , J Cu toate acestea, reducerea tranzistorilor va duce în curând la un aproape sigur că grosimea acestor dispozitive va fi redusă la câțiva atomi In acest • tranzistoarele izdii vor deveni prea mici pentru o funcționare fiabilă sau • Vom ajunge la un punct în care reducerea ulterioară va necesita elemente subatomice și create de om În ciuda tuturor problemelor viitoare cu legea lui Moore, tehnologii promițătoare au apărut deja la orizont, cum ar fi calculul cuantic [Oskin et al , ] și nanotuburile de carbon [Heinze et al , ] Poate că ne vor permite să împingem scara componentelor electronice dincolo de limitele inerente siliciului Legea lui Moore este legată de ceea ce unii economiști numesc ciclul eficient Progresele în tehnologia computerelor (creșterea numărului de tranzistori pe un singur cip) duc la produse de mai bună calitate și prețuri mai mici Prețurile mici duc la noi aplicații (nimănui nu i s-a întâmplat niciodată să dezvolte jocuri pe calculator când computerul avea milioane de dolari – deși când prețul a scăzut la de dolari, studenții MIT erau în funcțiune) Noile aplicații duc la apariția de noi piețe de calculatoare și noi companii Existența tuturor acestor companii duce la concurență între ele, care, la rândul său, creează o cerere pentru tehnologii mai bune Cercul se închide Un alt factor în dezvoltarea tehnologiei informatice este prima lege a software-ului, numită după Nathan Myhrvold, unul dintre liderii Microsoft Această lege spune: „Software-ul este un gaz Se răspândește și complet dincolo de rezervorul în care se află În anii , procesarea electronică a textelor era efectuată de programe precum troff (programul troff a fost folosit pentru a crea această carte) Programul troff ocupă câteva zeci de kiloocteți de memorie Editoarele electronice moderne ocupă / adică megaocteți moale În viitor, fără îndoială, vor lua zeci de gi-nibytes (în prima aproximare, prefixele „kilo”, „mega” și „giga” înseamnă altă organizație internă și putea executa până la cinci comenzi ніі a dezvoltat arhitectura StrongARM, care, de la prima apariție a lui i și nt ia, a fost popularizată datorită vitezei mari ( MHz) și super low-> Și nmіініні ні (I watt) Eficiența a fost asigurată de o structură simplă, clară rmіі іr іi і'іanіііііsі două cache de kilobyte pentru comenzi și date Braț puternic • și „pr” і'Мііки în DEC s-au bucurat de un succes comercial moderat ei • Nі ііі'іnііа'іig în multe PDA-uri, set-top box-uri, multi- • »■♦ nіpin іch dispozitive și rute H „rinită, cea mai faimoasă dintre arhitecturile ARM a fost procesorul ARM , care a fost lansat de ARM în și continuă să fie utilizat pe scară largă h iiiiii și ()n conține cache-uri separate de instrucțiuni și date, precum și implementează • ” p i irnzny Set de instrucțiuni Thumb - o versiune scurtată a întregului de biți ' - comenzi ihihiipii ARM, care vă permite să programați multe min ricin standard în instrucțiuni mai mici de biți, reducând semnificativ cantitatea de „memorie gestionată” Procesorul era potrivit pentru o gamă largă • ♦I *i ” n ir sisteme încorporate neproductive, printre care se numărau ri і іi pietre prețioase de control al motorului și chiar un dispozitiv de joc portabil (uiineboy Advance II și II notează de la multe companii de calculatoare, ARM nu produce micro-i pііііііі|іy În schimb, firma creează arhitecturi, instrumente de dezvoltare și le acordă licențe proiectanților de sisteme și producătorilor de cipuri De exemplu, tabletele Samsung Galaxy Tab *»-i și Android au folosit un procesor ARM Galaxy Tab conține unul sau mai multe procesoare Tegra , inclusiv două procesoare ARM Cortex-A • |'»»|hpii i procesor Nvidia GeForce Nucleele Tegra au fost proiectate de HM și implementate în arhitectura Nvidia cu un singur cip și lansate de TSMC і і in ііі Semiconductor Manufacturing Company) În fața noastră este un impresionant i ні rі і іnrudnichestvo companii din diferite țări, în care fiecare companie > і ік іy contribuție la rezultatul final II i рі este prezentată fotografia substratului sistemului cu un singur cip în Igcia Este format din trei procesoare ARM: două nuclee ARM Cortex • • Miezuri I III și ARM Cortex-A - nucleu dual-threaded cu neordonat execuția instrucțiunilor, echipată cu un cache - de megabyte și suport pentru multiprocesare cu memorie partajată (Există o mulțime de jargon tehnic obscur aici, dar vom ajunge la acești termeni în capitolele ulterioare Deocamdată, este suficient să știm că aceste caracteristici fac procesorul foarte rapid!) ARM este un nucleu ARM mai mic și mai vechi folosit pentru sistem configurarea și gestionarea energiei Nucleul grafic este o unitate de procesare grafică (GPU) GeForce de MHz optimizată pentru funcționare cu putere redusă Tegra include, de asemenea, un encoder/decodor video, un procesor audio și o interfață de ieșire video HDMI i wS# >- ; ” YAK ' și * I l Procesor: decodare video ^codare date video semnal Zhtiroiessor ^Procesor audio video & Procesor Cortex A Procesor Cortex A '*'-al-lea Intrare ieșire Suport pentru ecran dublu ■ t > GPU jHDMI NAND * eu * ; USB Orez Sistem NvidiaTegra cu un singur cip (fotografie folosită cu permisiunea Nvidia Corporation) Arhitectura ARM a avut un succes uriaș în sectoarele de putere redusă, mobil și încorporat În ianuarie , ARM a anunțat că vânzările de procesoare ARM au ajuns la miliarde de la lansare și că vânzările continuă să crească În timp ce arhitectura ARM este adaptată pentru piețele low-end, are potențial de calcul pentru orice piață, iar unele semne indică o posibilă extindere a orizontului De exemplu, în octombrie , a fost anunțat un procesor ARM pe de biți Tot în ianuarie , Nvidia a anunțat Project Denver, un sistem cu un singur cip bazat pe ARM pentru server și alte piețe Arhitectura va conține mai multe procesoare ARM pe de biți cu mai multe procesoare grafice de uz general (GPGPU, GPU general) Consumul mai mic de energie va ajuta la reducerea cerințelor de răcire ale fermelor de servere și centrelor de date Familii de calculatoare la Intră în arhitectura AVR Al treilea exemplu este foarte diferit de primul (arhitectura x folosită în computerele personale și servere) și al doilea (arhitectura ZIM utilizată în PDA-uri și smartphone-uri) Arhitectura AVR este utilizată de sisteme încorporate extrem de low-end Istoria AVR în la Institutul Norvegian de Tehnologie, când studenții Alf-Egil Bogen și Vegard Wollan au proiectat un procesor RISC pe biți numit AVR Potrivit zvonurilor, acest nume a fost ales pentru că era „procesorul RISC Alf și Vegard” ((A)lf și ГV )t"fllir = ) // Dacă data loc=-l, atunci nu există operand data=memory[data loc]; // Apel de date rexecute(instr type,data); // Executarea comenzii eu eu private static int get instr type(int adresa) { } private static int find data(int instr, int tip) { } private static void execute(int tip, int date) { } Însuși faptul că se poate scrie un program care simulează funcționarea unei unități centrale de procesare arată că programul nu trebuie să fie executat de un procesor (dispozitiv) real Dimpotrivă, un alt program poate apela din memorie, poate determina tipul de comenzi și poate executa aceste comenzi Un astfel de program se numește interpret Am vorbit despre interpreți în capitolul Echivalența procesoarelor hardware și a interpreților are implicații importante pentru organizarea computerelor și proiectarea sistemului informatic După ce dezvoltatorul a ales un limbaj de mașină (I) pentru un nou computer, el trebuie să decidă dacă să dezvolte un procesor care să execute programe în limbajul I, sau să scrie un program special pentru interpretarea programelor în aceeași limbă Dacă decide să scrie un interpret, va trebui să dezvolte hardware-ul pentru a rula acel interpret Proiectele hibride sunt de asemenea posibile, atunci când unele comenzi sunt executate de hardware, iar unele sunt interpretate Interpretul împarte comenzile în comenzi mai mici (elementare) Ca rezultat, o mașină proiectată să ruleze un interpret poate fi mult mai simplă și mai ieftină decât un procesor care rulează programe fără interpretare Astfel de economii sunt deosebit de importante cu un număr mare de comenzi complexe cu parametri diferiți În esență, economiile provin din însuși faptul de a înlocui hardware-ul cu un program (interpret), în timp ce a face copii ale unui produs software este mai ieftin decât a face copii ale elementelor hardware Primele computere acceptau un număr mic de comenzi, iar aceste comenzi erau simple Cu toate acestea, dezvoltarea unor computere mai puternice a dus, printre altele, la apariția unor comenzi mai complexe Dezvoltatorii și-au dat seama curând că, cu comenzi complexe, programele rulează mai repede, deși fiecare comandă individuală durează mai mult (Exemple de astfel de instrucțiuni complexe includ efectuarea de operații în virgulă mobilă, furnizarea de acces direct la elementele matricei și așa mai departe ) Dacă s-a constatat că o pereche de instrucțiuni particulare este adesea executată secvenţial, a fost adesea introdusă o nouă instrucțiune pentru a le înlocui pe acestea două Comenzile complexe erau, de asemenea, mai bune, deoarece unele operațiuni se suprapuneau uneori Astfel de operațiuni puteau fi efectuate în paralel, dar aceasta necesita echipament suplimentar Pentru computerele scumpe, de înaltă performanță, acest hardware suplimentar a meritat să fie cumpărat Astfel, computerele scumpe aveau mult mai multe comenzi decât cele ieftine Cu toate acestea, creșterea costului de dezvoltare și cerințele de compatibilitate a comenzilor au dus la faptul că comenzile complexe au fost utilizate în computerele cu costuri reduse, deși acolo costul a fost în prim-plan, nu viteza Până la sfârșitul anilor , IBM, care era pe atunci lider pe piața calculatoarelor, a decis că producția unei familii de calculatoare, fiecare dintre ele executând aceleași comenzi, este mai profitabilă pentru companie însăși și pentru clienți Pentru a caracteriza acest nivel de interoperabilitate, IBM a inventat termenul de arhitectură Noua familie de calculatoare trebuia să aibă o singură arhitectură și multe modele diferite, care diferă ca preț și viteză, nm • capabil să execute aceleaşi programe Dar cum construiești un computer ieftin care poate executa toate comenzile complexe care sunt concepute pentru și mașini scumpe și eficiente? Soluția a fost interpretarea Această tehnologie, lansată de Wilkes în , a permis dezvoltarea unor componente simple, cu costuri reduse, care puteau totuși executa un număr mare de comenzi În a doua jumătate a secolului, IBM a creat arhitectura System/ , o familie de computere compatibile care diferă ca preț și performanță cu aproape un ordin de mărime Hardware care vă permite să lucrați fără interpretare este disponibil doar în cele mai scumpe modele Calculatoarele simple cu interpreți de comandă aveau meritele lor ІІіннпіе importante printre ei au fost: ♦ capacitatea de a corecta comenzile implementate incorect „la fața locului” pin chiar să compenseze erorile hardware la nivel hardware; ♦ posibilitatea de a adăuga comenzi noi la costuri minime și, dacă este necesar, după achiziționarea unui computer; ♦ capacitatea (datorită unei organizații structurate) de a dezvolta, testa și documenta comenzi complexe II / ani, piata calculatoarelor a crescut rapid, calculatoarele noi mn indeplinesc tot mai multe functii Datorita cererii crescute de calculatoare ieftine, s-a dat preferinta calculatoarelor cu in-n rprs ha munti Capacitatea de a proiecta hardware cu un inter-nrі'ііііtor pentru un set specific de instrucțiuni a dus la apariția procesoarelor ieftine Tehnologia semiconductoarelor s-a dezvoltat rapid, au prevalat costurile reduse și performanța ridicată, iar interpreții au început să fie utilizați din ce în ce mai pe scară largă în dezvoltarea computerelor Interpretarea nu a fost folosită în aproape toate computerele lansate în anii , de la minicalculatoare până la cele mai mari mașini Până la sfârșitul anilor , interpreții erau utilizați în aproape toate, cu excepția celor mai scumpe mașini cu performanțe foarte ridicate (de exemplu, Cray- și computerele din seria Control Data Cyber ) Interpreții au reușit să implementeze instrucțiuni complexe fără a folosi apna-|nii ura costisitoare, astfel încât dezvoltatorii au putut introduce instrucțiuni din ce în ce mai complexe, dar niciodată (și chiar mai ales) să extindă modurile în care operanzii erau definiți ha tendința a atins apogeul în computerul VAX dezvoltat de DEC; avea câteva sute de instrucțiuni și mai mult de de moduri de a defini operanzi în fiecare instrucțiune Din păcate, arhitectura VAX de la bun început a fost orientată spre interpretare, iar performanța a fost axată pe ui Acest lucru a dus la apariția unui număr mare de yimiid minore, care erau dificil de executat direct Această omisiune a fost fatală atât pentru VAX, cât și pentru producătorul său (DEC) Compaq a cumpărat DEC în (deși Compaq a devenit parte a Hewlett-Packard trei ani mai târziu) Deși primele microprocesoare pe biți erau foarte simple și suportau un set mic de instrucțiuni, până la sfârșitul anilor chiar și ele deveniseră să fie dezvoltate având în vedere un interpret În această perioadă, principala problemă pentru dezvoltatori a fost complexitatea tot mai mare a microprocesoarelor Principalul avantaj al interpretării a fost că era posibil să se dezvolte un procesor foarte simplu, iar toate cele mai complexe lucruri puteau fi implementate folosind un interpret Astfel, în loc să se dezvolte hardware complex, a fost necesar să se dezvolte un software complex Succesul sistemului Motorola cu un set mare de instrucțiuni interpretabile și eșecul simultan al computerului Zilog Z , care avea un set la fel de mare de instrucțiuni, dar fără interpret, au demonstrat beneficiile interpretării în dezvoltarea de noi mașini Acest succes a fost destul de neașteptat, având în vedere că computerul Z (predecesorul lui Zilog Z ) a fost mai popular decât Motorola (predecesorul lui Motorola ) Bineînțeles, și alți factori au jucat un rol, cum ar fi faptul că Motorola a fost în afacerea cu cipuri de mulți ani, iar marca Zilog era deținută de Exxon, o mare companie petrolieră Un alt factor în favoarea interpretării este existența unor dispozitive de memorie de mare viteză, doar în citire, pentru stocarea interpreților (așa-numitele ROM-uri de comandă) Să presupunem că, pentru a executa o instrucțiune interpretată normal, interpretul computerului Motorola trebuie să execute instrucțiuni (se numesc microinstrucțiuni), câte ns fiecare și să facă două accesări la RAM, câte ns fiecare Timpul total de execuție pentru instrucțiune ar fi, prin urmare, de ns - doar de două ori mai mult decât ar fi nevoie, în cel mai bun caz, pentru a executa direct instrucțiunea fără interpretare Și dacă nu ar exista o memorie specială de mare viteză doar pentru citire, execuția acestei instrucțiuni ar dura până la ns O creștere de șase ori a timpului de rulare este mult mai greu de suportat Sisteme RISC și CISC La sfârșitul anilor , au existat multe experimente cu comenzi foarte complexe, care au fost posibile prin interpretare Dezvoltatorii au încercat să reducă „decalajul semantic” dintre ceea ce pot face computerele și ceea ce necesită limbajele de nivel înalt Aproape nimeni nu s-a gândit atunci să dezvolte mașini mai simple, așa cum puțini oameni acum (din păcate) dezvoltă foi de calcul, rețele, servere web etc mai puțin puternice La IBM, această tendință a fost contracarată de un grup de dezvoltatori condus de John Cock (John Sosuke); au încercat să întruchipeze ideile lui Seymour Cray prin crearea unui minicomputer experimental de înaltă performanță dezvoltarea unor astfel de arhitecturi În , o echipă de dezvoltare de la Universitatea Berkeley condusă de David Patterson și Carlo Sequin a început să dezvolte i HiiMihV ns procesoare VLS orientate spre interpretare |Patterson, iMUerson și Squin, ] Pentru a denota acest concept, au venit cu rmip RISC, iar noul procesor a fost numit RISC I, care a fost urmat în curând de ♦n nіѵіcen RISC' II Puțin mai târziu, în , John Hennesy (John Hennesy) n i nch | yurde a dezvoltat și a lansat un alt microcircuit, pe care l-a numit МІІ'Ч I Hennessy, ] Aceste două cipuri s-au dezvoltat în inovațiile SPARC și, respectiv, MIPS importante din punct de vedere comercial Noile procesoare erau semnificativ diferite de procesoarele comerciale • •la timp Deoarece erau incompatibile cu produsele existente, erau liberi să includă noi seturi de instrucțiuni care ar putea îmbunătăți performanța generală a sistemului Inițial, accentul principal a fost pe comenzi simple care puteau fi executate rapid, u iiiiiiho în curând dezvoltatorii și-au dat seama că cheia performanței înalte * • În computer este să dezvoltați comenzi pe care le puteți rula rapid În ii n» nu este atât de important cât timp se execută această sau acea comandă, ceea ce este mai important este câte comenzi pe secundă pot fi executate II La momentul în care erau dezvoltate aceste procesoare simple, un număr relativ mic de instrucțiuni (de obicei în jur de ) a atras atenția generală I і»і і ecuații: numărul de instrucțiuni din calculatoarele VAX fabricate de DEC și mare » nmіoter fabricat de IBM la acea vreme a variat de la la Calculatorul MIM (Reduced Instruction Set Computer) era opus CISC (Complex Instruction) Set) sistem Computer - yimviewer cu un set complet de comenzi) - un indiciu subțire voal de pa • Nmpі'Uter VAX, care domina la acea vreme în mediul universitar Pe • ♦ În a -a zi a zilei, puțini oameni cred că dimensiunea setului de instrucțiuni este atât de importantă, dar unele exemple au supraviețuit până în zilele noastre Și din acel moment a început un grandios război ideologic între strictul RISC și „conservatori” (mainframe VAX, Intel, IBM) În opinia altora, cel mai bun mod de a proiecta computere este să includă un mic * han și un număr de instrucțiuni simple, fiecare dintre ele executată într-un ciclu de date і | wі> і (vezi Fig ), adică , produce un fel de і|іііі|ім i іііglyіo, două comenzi nu trebuie să intre în conflict asupra resurselor (de exemplu, |n i ig і ditch) și nici una dintre ele nu trebuie să depindă de rezultatul executării celeilalte Ca și în cazul unei singure comenzi pipeline , sau compilatorul trebuie să garanteze absența situațiilor de urgență (când, de exemplu, echipamentul nu verifică comenzile de incompatibilitate și, la procesarea unor astfel de comenzi, dă un rezultat incorect), sau conflictele trebuie detectate și eliminate de echipamente suplimentare direct în timpul executării comenzilor С С СЗ С С Scrieți bloc în registre Scrieți bloc în registre Orez Conductă dublă în cinci trepte cu o unitate comună de preluare a instrucțiunilor La început, conductele (atât duale, cât și convenționale) au fost utilizate numai în calculatoarele RISC Procesorul și predecesorii săi nu le aveau, procesoarele Intel au introdus doar conducte începând cu modelul Procesorul avea o conductă în cinci etape, iar Pentium avea două astfel de conducte O schemă similară este prezentată în Fig , dar împărțirea funcțiilor între a doua și a treia etapă (au fost numite decodor și decodor ) a fost ușor diferită Conducta principală (u-pipeline) ar putea executa comenzi arbitrare A doua conductă (v-pipeline) ar putea executa doar instrucțiuni întregi simple, precum și o instrucțiune simplă în virgulă mobilă (FXCH) Verificarea compatibilității comenzilor pentru execuția paralelă se efectuează conform unor reguli stricte Dacă comenzile dintr-o pereche erau complexe sau incompatibile, doar una dintre ele a fost executată (în u-pipeline) Cea de-a doua echipă rămasă a fost egalată cu următoarea echipă Comenzile au fost întotdeauna executate în ordine Compilatoarele speciale pentru procesorul Pentium împerecheau instrucțiuni compatibile și puteau genera programe care rulau mai repede decât versiunile anterioare Măsurătorile au arătat că programele care folosesc operații cu numere întregi la aceeași frecvență de ceas rulează de două ori mai repede pe Pentium decât pe [Pountain, ] Câștigul în viteză a fost obținut datorită celei de-a doua conducte Tranziția la patru conducte este posibilă, dar necesită hardware greoi (rețineți că informaticienii, spre deosebire de folclorişti, nu cred în numărul norocos trei) În schimb, se folosește o abordare diferită Ideea principală este o conductă cu multe blocuri funcționale, așa cum se arată în Fig Intel Core, de exemplu, are o structură similară (o vom analiza în detaliu în Capitolul ) În , termenul de arhitectură superscalar a fost introdus pentru a se referi la această abordare [Agerwala și Soske, ] Cu toate acestea, o idee similară a fost întruchipată cu mai bine de de ani în urmă în computerul CDC Acest computer a numit o instrucțiune din memorie la fiecare ns și a plasat-o într-unul din cele blocuri funcționale pentru execuție paralelă În timp ce comenzile erau executate, CPU a apelat următoarea comandă Trebuie menționat că funcționarea paralelă a unităților de procesor individuale a avut loc în microprocesorul anterior ( ) Acest mecanism a devenit prototipul conductei în etape a microprocesorului - Notă științific ed C CI hiioM în lume mimind Orez Procesor superscalar cu cinci blocuri funcționale I și remnsm definiția „superscalar” s-a schimbat oarecum Acum - în | n kalyarpy sunt procesoare care pot rula mai multe com-mnn / i l Conectarea la rețea Memoria comună Orez Fermi GPU SIMD Core acestea din două registre vectoriale într-un sumator cu o structură transportoare Ca urmare, din sumator iese un alt vector, care fie este plasat în registrul vectorial, fie imediat folosit ca operand la efectuarea unei alte operații cu vectori Instrucțiunile Streaming SIMD Extension (SSE) din arhitectura Intel Coge folosesc acest model de extensie pentru a accelera calcule foarte ordonate, cum ar fi procesarea datelor multimedia și științifice În acest sens, computerul ILLIAC IV poate fi considerat unul dintre progenitorii procesorului Intel Core Multiprocesoare Elementele unui procesor paralelizat de date sunt interconectate, deoarece activitatea lor este controlată de o singură unitate de control Un sistem de mai multe procesoare paralele care partajează o memorie comună se numește multi-procesor irnschchch'or Deoarece fiecare procesor poate scrie informații în și din orice parte a memoriei și poate citi informații din orice parte a memoriei fără nicio inconsecvență, funcționarea lor trebuie să fie coordonată de software Într-o situație în care două sau mai multe procesoare au o interacțiune strânsă, și exact acest lucru se întâmplă în cazul multi-inn|nshe > se află în general separat Șirul este inversat deoarece computerul citește mai întâi octetul (spațiu), apoi octetul (M) și așa mai departe Nu există o soluție simplă Există o singură cale, dar este ineficientă (Trebuie să puneți un antet înaintea fiecărei unități de date, indicând ce tip de date urmează - șir, întreg etc Acest lucru va permite computerului receptor să efectueze doar conversiile necesare ) În mod clar, lipsa unui standard de ordonare a octetilor este o problemă serioasă în schimbul de informații între diferite mașini Cod de corectare a erorilor Pot apărea din când în când erori în memoria computerului din cauza supratensiunii și din alte motive Pentru a le combate, se folosesc coduri speciale care pot detecta și corecta erorile În acest caz, se adaugă biți suplimentari fiecărui cuvânt din memorie într-un mod special Când un cuvânt este citit din memorie, acești biți suplimentari sunt verificați pentru a detecta erori Pentru a înțelege cum să tratați erorile, trebuie să studiați cu atenție ce reprezintă aceste erori Să presupunem că cuvântul este format din m biți ai lui Anin, la care adăugam suplimentar Gbps (biți de verificare) u și lungimea totală a cuvântului va fi de n biți (adică n = mn + r) O unitate de n biți, - și care reprezintă m biți de date și r biți de control, este adesea numită cod Eu 'unom Având în vedere două cuvinte de cod, de exemplu și , puteți determina câți biți corespunzători diferă în ele În acest exemplu, niiih trei mari Pentru a determina numărul de biți diferiți, este necesar să se efectueze o operație logică EXCLUSIVĂ pe cuvinte de cod PV II III și ('"să numără numărul de biți cu o valoare de în rezultat Numărul de poziții inferioare în care două cuvinte diferă se numește intervalul Z'imming | Hamming, ] De exemplu, intervalul Hamming pentru cuvintele de cod și sunt |niiign , deoarece trei serii de erori h/Ti sunt suficiente pentru a transforma primul cuvânt în al doilea Memoria este formată din cuvinte ///-biți, prin urmare, există m opțiuni-iiii (puncte de biți Cuvintele de cod constau din n biți, dar datorită modului în care sunt numărați biții I I I l , sunt permise doar m de cuvinte de cod de " Dacă într-un cuvânt de cod invalid este eliminat din memorie, computerul știe că a apărut o eroare Dacă există un algoritm pentru numărarea cifrelor de verificare, este posibil să compuneți o listă completă de cuvinte de cod valide și din această listă să găsiți două cuvinte, în care intervalul Hamming va fi minim Acesta este codul complet al intervalului Hamming ii Capacitatea de a verifica și corecta erorile unui anumit cod depinde de intervalul Hamming Pentru a detecta d erori de un bit, trebuie să căutăm codul la intervale de d + , deoarece erorile d nu pot transforma un cuvânt de cod dedus într-un alt cuvânt de cod valid În consecință, corectarea d erorilor pe un singur bit necesită un cod cu un interval de d - , în acest caz, gama largă de cuvinte de cod valide este atât de diferită între ele încât, chiar dacă apar modificări d, codul original • 'інію va fi mai aproape de eronat decât orice alt cuvânt de cod, astfel încât 'іо г;і munca poate fi identificat II Ca exemplu simplu de cod de detectare a erorilor, luați în considerare un cod care are un bit de paritate adăugat la date Bit de paritate selectabil • și și astfel încât numărul de biți cu valoarea din cuvântul de cod să fie pin (sau impar) Intervalul Hamming pentru acest cod este , deoarece fie o eroare de un bit are ca rezultat un cuvânt de cod de paritate incorect Cu alte cuvinte, două erori de un bit sunt suficiente pentru tranziție • • і un cuvânt de cod valid la un alt cuvânt de cod valid Un astfel de cod poate fi folosit pentru a detecta erori individuale Dacă din memorie iiiiig un cuvânt cu paritate proastă, este semnalată o eroare Programul hi i jumătate cinci nu va putea, dar nu va da rezultate incorecte Ca exemplu simplu de cod de corectare a erorilor, luați în considerare un cod cu patru cuvinte de cod valide: , , ii Intervalul Hamming pentru acest cod este , ceea ce înseamnă că poate corecta erori duble Dacă apare cuvântul de cod , computerul știe că inițial arăta ca (dacă nu au existat mai mult de două erori) Dacă apar trei erori (de exemplu, cuvântul se schimbă în ), această metodă nu este potrivită Imaginați-vă că vrem să dezvoltăm un cod cu m biți de date și r biți de verificare care va corecta toate erorile pe un singur bit Fiecare dintre cele cuvinte valide are n cuvinte de cod nevalide care diferă de cele valide unul câte un bit Ele sunt formate prin inversarea fiecăruia dintre cei n biți din cuvântul de cod de n biți Prin urmare, fiecare dintre cele m de cuvinte valide necesită n + combinații posibile de biți alocați acestui cuvânt (n opțiuni posibile eronate și una corectă) Deoarece numărul total de combinații diferite de biți este ", atunci (n + ) m aproape dublându-se la fiecare , ani Cu toate acestea, situația este diferită cu performanța dis-ichnі dg/i() În anii , timpul mediu de căutare în minicalculatoare • »n yіі»іyalo de la la de milisecunde Acum timpul de căutare este de aproximativ mp'ilisgkund În multe industrii tehnice (de exemplu, în industria auto • • „în industria aviaţiei), o creştere a productivităţii de sau | „și eu timp de două decenii ar fi considerat grandios, dar în industria computerelor • cifrele і|іін și н sunt derutante Astfel, decalajul dintre producția de procesoare și discuri a continuat să crească în tot acest timp după cum am văzut deja, pentru a crește viteza procesorului, în tehnologia paralelă de procesare a datelor în іi і 'іі' іuіotsya De mulți ani, diferiți oameni au venit cu ideea că ar fi frumos • și ic și capacitatea de a plasa date audio și video, precum și texte obișnuite și un sector, care era necesar pentru compactele multimedia uni O altă problemă care trebuia abordată în dezvoltarea unităților de disc a fost compatibilitatea sistemului de fișiere Pentru ca același CD să fie utilizat pe computere diferite, este necesar un acord de sistem de fișiere CD-ROM Nevada și a dezvoltat un sistem „I’nII” pe care l-au numit High Sierra (după localitatea în care s-au adunat ) Acest sistem mai târziu a evoluat în Standardul Internațional (IS ) Există trei niveluri ale acestui standard La nivelul -* "" I, sunt permise nume de fișiere de până la caractere, numele fișierului poate fi urmat și de o extensie de până la caractere (convenția de denumire a fișierelor MS DOS) Numele fișierelor pot conține doar litere mari, numere și simbolul subliniază Acceptă imbricarea directoarelor la adâncimi mai mari de nivele Numele directoarelor poate să nu conțină o extensie nu prezintă nicio dificultate în cazul unui transportator pe care informațiile sunt înregistrate nu mai mult de o dată Orice CD care respectă standardul IS i Ronin i poate fi citit pe MS-DOS, computere Apple, computere Unix și practic orice altele Producătorii de CD-uri văd acest lucru ca un mare plus Nivelul al IS permite nume de fișiere de până la de caractere, iar Nivelul permite nume de fișiere necontigue Extensiile Rock MhlHr (numite după orașul din Burning Saddles al lui Mel Brooks) oferă nume de fișiere foarte lungi (pentru UNIX), UID-uri și ISH) și legături simbolice, dar CD-urile care nu sunt conforme cu nivelul nu pot fi citite pe computerele mai vechi eu muk'ii CD-urile sunt cu două ordine de mărime mai mici decât capacitatea discurilor magnetice moderne - Notă Discuri CD-R La început, echipamentul necesar pentru realizarea discurilor master (atât audio, cât și computer) era foarte scump Dar, așa cum este obișnuit în industria computerelor, nimic nu rămâne scump pentru prea mult timp Până la mijlocul anilor , inscriptoarele de CD-uri nu mai mari decât un player erau obișnuite și ușor disponibile în orice magazin de calculatoare Aceste dispozitive erau încă diferite de discurile magnetice, deoarece informațiile scrise odată pe un CD nu mai puteau fi șterse Cu toate acestea, au găsit rapid spațiu ca medii de stocare suplimentare, iar hard disk-urile au continuat să servească drept suport principal În plus, persoane fizice și companii mici au reușit să-și lanseze propriile CD-uri în loturi mici sau să producă mastere și să le livreze către marile duplicatoare comerciale Aceste discuri se numesc CD-R (CD-Recordable) Baza unui disc CD-R este un semifabricat din policarbonat de mm Aceleași spații libere sunt folosite în producția de discuri CD-ROM Cu toate acestea, discurile CD-R diferă de discurile CD-ROM prin faptul că conțin o canelură lățime de , mm concepută pentru a ghida laserul în timpul scrierii Pentru a menține un feedback constant, canelura este sinusoidală cu o abatere de , mm și o frecvență de exact , kHz, astfel încât viteza de rotație să poată fi determinată cu precizie și ajustată dacă este necesar Un CD-R arată ca un disc normal, doar că nu este argintiu, ci auriu, deoarece aurul este folosit pentru a face stratul reflectorizant în loc de aluminiu Spre deosebire de CD-urile convenționale, găurile și terenurile de pe discurile CD-R sunt simulate prin modificarea reflectivității suprafeței Pentru a face acest lucru, un strat de colorant este plasat între stratul de policarbonat și stratul de aur reflectorizant (Fig ) Sunt utilizate Eticheta , mm Strat de lac protector strat reflectorizant Strat j vopsesc Punctul negru de pe stratul de colorant este format prin scriere cu laser Policarbonat Baza Directia rotatiei Obiectiv Fotodetector Infraroşu dioda laser Orez Secțiune transversală a discului CD-R și a laserului (nu la scară) Un CD convențional are o structură similară, dar nu are un strat de colorant, iar în loc de un strat de aur se folosește un strat de aluminiu cu găuri *în ініДіі colorant: verde cianină și ftalocianină gălbui-portocaliu ін-іа Chimiștii pot argumenta la infinit care dintre ele este mai bună Ulterior, stratul reflectorizant auriu a fost înlocuit cu aluminiu În stadiul incipient I-I, stratul de colorant este transparent, permițând luminii yn'rnului să treacă și să se reflecte în stratul de aur La înregistrarea informațiilor, puterea laserului crește la - mW Când fasciculul ajunge la colorant, roșu • in» 'іb se încălzește și, ca urmare, legătura chimică este distrusă O astfel de schimbare a h - igk într-o structură pașnică creează o pată întunecată Când citiți (când laserul este alimentat • • și nsh/ijg , mW) fotodetectorul detectează diferența dintre petele întunecate, unde gelul nu a fost deteriorat, și zonele transparente, unde colorantul rămâne neatins Când redați un disc, chiar și pe un cititor CD convențional sau un player audio, această diferență este percepută ca o diferență între orificiile și plăcuțele unui disc CD-ROM tradițional Niciun nou tip de CD nu era complet fără publicarea parametrilor unei anumite culori În cazul CD-R-ului, a fost Cartea Portocalie, datată Acest document descrie un disc CD-R, precum și un nou format, I II COM XA, care permite scrierea progresivă a informațiilor pe un CD-R (de mai multe sectoare astăzi, câteva mâine, câteva luni mai târziu etc ) Un grup de sectoare individuale înregistrate la un moment dat se numește pistă (Imaginarul primelor aplicații ale formatului CD-R a fost CD-ul foto al companiei I ніік Cu această tehnologie, filmul și fotografia expuse și numele și discul cu imagini vechi sunt introduse în procesor, care Inapoi CD, adaugand in prealabil (dupa cele vechi) pozele din filmul expus Noul pachet de date, obținut prin scanarea negativelor, este scris pe un CD ca o piesă Această metodă de înregistrare este necesară, deoarece spațiile pentru dis-min R sunt prea scumpe și nu este rentabil să înregistrați fiecare bandă nouă pe o nouă lună I Scăzut Odată cu apariția acestei tehnologii de înregistrare, a apărut o nouă problemă |și nm a Cărții Portocalii la începutul tuturor CD-urilor a fost un singur „Hippies VTOC (Cuprins volum - cuprins al discului), din cauza niira a fost imposibil să adăugați informații pe disc Soluția problemei a fost propunerea de a atribui fiecărei piese de pe disc propriul tabel VTOC II 'pentru fișierele listate în tabelul VTOC, toate fișierele |mm" timp în care tamburul de toner este apăsat pe hârtie, lăsând pe ea o non-imagine Foaia este apoi trecută prin role încălzite și imaginea este flash După aceea, tamburul este descărcat și tonerul rămas este curățat IIWK”, Acum este gata să imprime următoarea pagină Nu este deloc necesar să spunem că acest proces este o combinație extrem de variată de tehnici care necesită cunoștințe de fizică, chimie și mecanică a ISHGGIKI Cu toate acestea, unele firme oferă module gata făcute numite motoare prinț Producătorii de imprimante laser adaugă unități de imprimare KIPT cu propriile electronice și software IVCtronics imprimantelor laser consta dintr-un procesor rapid SI Fara megabytes de memorie pentru a stoca imaginea completa intr-un pic ferm si diverse fonturi, dintre care unele sunt incorporate iar altele sunt incarcate N imagine I antova form din CPU) Aceste comenzi sunt de obicei date în , MMK PCL de la HP sau PostScript de la Adobe - limbaje de programare cu drepturi depline, deși specializate Imprimantele laser cu o rezoluție de dpi și mai mare pot produce fotografii alb-negru, dar tehnologia este mult mai complexă decât ar părea la prima vedere Să luăm în considerare o fotografie scanată la dpi I |#, care trebuie tipărită pe o imprimantă cu aceeași rezoluție ( dpi) HDD pentru imagini scanate (> x pixeli pe inch, fiecare pixel este caracterizat printr-o scară uniformă de gri de la (alb) la (negru) poate fi fie negru (când este prezent toner) fie alb (când nu este prezent toner) ) Tonuri de gri nu pot fi imprimate La imprimarea unor astfel de imagini are loc așa-numita procesare semi-HIHON (ca la tipărirea posterelor în serie) Imaginea este împărțită în celule, YY DAY dar x pixeli Fiecare celulă poate conține de la la de cuvinte negre NIS Pentru ochiul uman, o celulă cu mulți pixeli negri pare mai întunecată decât o celulă cu puțini pixeli negri HNI-urile gri în intervalul de la la sunt transmise după cum urmează Această bandă de-IIGen are de zone Tonurile de gri de la la sunt situate în zona , de la la - în zona și і d (zona este puțin mai mică decât celelalte, deoarece cu fără urmă nu este He іi kzі) Când tonurile zonei se întâlnesc, celula rămâne albă, așa cum se arată în fig , a Tonurile din zona sunt reprezentate de un pixel negru per celulă Top ipny cu doi pixeli pe celulă, așa cum se arată în fig , Imaginile cu tonuri vryh ale altor zone sunt prezentate în fig , , in-e Dacă o fotografie este scanată ••și despre Imaginea semitonurilor gri din diferite zone: - (a); - (b); - (i); - (d); - (e); - (e) A , churipizicina sistemelor informatice wana cu o rezoluție de (Ірі, după o astfel de prelucrare a semitonurilor, rezoluția reală a imaginii imprimate este redusă la de celule pe inch Această valoare se numește gradația semitonurilor Kv | măsurată în Ірі (linii pe inch - linii pe inch) L Imprimante color J Deși imprimantele laser sunt cel mai adesea monocrome, color laM| Deoarece imprimantele devin din ce în ce mai răspândite, merită să spuneți și câteva cuvinte despre imprimarea color (și tot ce s-a spus este valabil și pentru imprimantele cu jet de cerneală și alte imprimante) Imaginile color pot fi construite de DI în două moduri: emisie de lumină și reflectare a luminii Emisia de lumină IMO( plasați, de exemplu, când creați imagini într-un monitor cu raze catodice În acest caz, imaginea este construită prin suprapunerea aditivă a tr în ambele direcții simultan (ca un fier de călcat cu o singură cale Fіrogn)t sunt numite semi-duplex Liniile de comunicație care pot transmite informații într-o singură direcție se numesc simplex Linii digitale de abonat Inn" a stabilit odată ștacheta la Kbps, inginerii companiei de telefonie cu un sentiment de „datorie HiHNMiiiieeip ogo” s-au odihnit pe lauri Între timp, furnizorii de televiziune prin cablu au început să ofere abonaților conexiuni la Internet I* prin cabluri partajate la viteze de până la Mbps Prestatori de servicii • Comunicațiile Nickel au mers și mai departe, oferind posibilitatea de a vă conecta la viteze de peste Mbps Cu cât serviciile n|іr/io au devenit mai importante pentru companiile de telefonie, cu atât au înțeles mai mult că, pentru a rămâne competitive, trebuie să ofere pieței un serviciu mai bun decât o conexiune convențională dial-up noul serviciu de Internet digital a ieșit la iveală, serviciile de Internet care oferă o lățime de bandă mai mare decât o conexiune de modem standard se numesc bandă largă, dar sincer să fiu, acesta este mai mult un termen de marketing decât un termen tehnic de fond • canale de semnal imaginare, în timp ce într-o conexiune în bandă îngustă există un singur astfel de canal Astfel, teoretic, o conexiune Ethernet de gigabit, care ondula mult mai repede decât orice conexiune „de bandă largă”, nu este bandă largă, deoarece are un singur canal de semnal Inițial, au fost propuse mai multe tehnologii de acces sub denumirea generală vDSL (Digital Subscriber Line - digital subscriber line) cu valoare x variabilă În continuare, vom discuta despre cele mai comune dintre ele - ADSL (Asymmetric DSL - asymmetric digital subscriber line) Lucrările la ADSL sunt încă în desfășurare și nu toate standardele pentru această caracteristică au fost notate, așa că unele detalii pot fi corectate în timp Cu toate acestea, imaginea de ansamblu este probabil să rămână neschimbată Pentru mai multe informații despre ADSL, a se vedea literatura suplimentară pHHHînrrs, , Vetter et al , ] De ce modemurile obișnuite sunt atât de lente? Da, pentru că inițial telefoanele au fost destinate transmisiei vocale și, având în vedere acest lucru, s-a format întregul sistem de comunicații telefonice Prea puțină atenție a fost acordată transmiterii de date prin firele telefonice Lățimea de bandă a firului (este, de asemenea, un canal de abonat) care conectează abonații cu o centrală telefonică automată (ATS) a fost în mod tradițional limitată la un fіі'іgrom special Debitul real al unui canal de abonat depinde în mare măsură de lungimea acestuia, dar cel mai adesea (dacă lungimea nu depășește (frecvența înaltă și de kilometri) ajunge la , MHz Cea mai comună schemă de livrare a serviciilor ADSL este prezentată în Fig Conținutul său se reduce la îndepărtarea filtrului și la separarea spectrului eliberat de , MHz în de canale autonome, fiecare la , Hz Capal este alocat pentru datele vocale Nu sunt utilizate canalele - , pentru care interferența reciprocă a semnalelor de voce și date este eliminată Din cele de frânghii, două sunt alocate pentru transmisie ascendentă și descendentă semnale de control Pentru alte canale, voi trimite datele utilizatorului Astfel, un modem ADSL este echivalent cu de modemuri obișnuite, Voltaj de canale la kHz kHz Vocea ascendentă Downdraft curgere Orez Funcționarea ADSL În principiu, un flux de date duplex poate fi trimis prin fiecare dintre canalele rămase, totuși, armonicile auxiliare, diafonia și alte efecte fizice nu permit aducerea implementării efective a tehnologiei la un nivel teoretic Este la latitudinea furnizorului de servicii să decidă cât de mult să împartă canalele în aval și în amonte Este posibil din punct de vedere tehnic să se distribuie aceste canale în mod egal, dar în majoritatea cazurilor - % sunt alocate organizației din aval (de obicei, de canale sunt alocate în amonte, iar restul în aval), deoarece majoritatea utilizatorilor primesc semnificativ mai multe date decât ei trimit Acesta este motivul pentru care tehnologia ADSL are atât de mult succes Calitatea transmisiei datelor pe fiecare canal este monitorizată constant și, dacă este necesar, corectată, astfel încât canalele pot diferi ca viteze Datele sunt transmise la până la biți/baud printr-o combinație de modulație de amplitudine și fază Dacă, de exemplu, de canale în aval sunt disponibile pentru transmisia de date, iar rata de semnalizare este de baud la bps, debitul total în aval este de , Mbps În practică, raportul semnal-zgomot nu permite abordarea acestui nivel, dar cu o distanță mică de furnizorul de servicii și o calitate ridicată a canalului, o viteză de - Mbps este destul de realizabilă O configurație tipică a echipamentului ADSL este prezentată în Figura Conform acestei scheme, la sediul utilizatorului este instalat un dispozitiv de interfață de rețea (Network Interface Device, NID) Această cutie mică de plastic simbolizează granița dintre proprietatea utilizatorului și proprietatea companiei de telefonie Lângă NID (și uneori în același caz cu acest dispozitiv) este instalat un splitter (splitter) - un filtru analogic care separă datele și semnalele la o frecvență de - Hz folosit pentru transmisia vocală Fluxul de date este trimis către modemul ADSL, iar semnalele vocale sunt trimise către telefon Modemul ADSL este un procesor de semnal digital care emulează funcționarea în paralel a de modemuri convenționale la frecvențe diferite Deoarece majoritatea modemurilor ADSL sunt disponibile într-o versiune externă, conexiunea lor la un computer trebuie să fie suficient de rapidă De obicei, această cerință este îndeplinită prin instalarea unei plăci Ethernet în computer și stabilirea unei conexiuni Ethernet cu două legături la modemul ADSL (Ethernetul este un standard comun și foarte accesibil pentru organizare іоуііыіх (așteptați ) Uneori, modemul ADSL este conectat la computer prin USB-Strі, În viitor, ar trebui să ne așteptăm la apariția unor carduri speciale pentru conectarea modemului ADSL Comutator Iphone codec Splitter DSLAM j ) j □ Kpnal și furnizor de servicii modem ADSL Orez Configurație standard a echipamentelor ADSL I Li pe partea opusă a canalului de abonat, este instalat un alt ііnpter, care separă semnalele vocale și le redirecționează către un comutator telefonic obișnuit Semnalele de peste kHz sunt transmise către Multiplexorul de acces la linia de abonat digital (Digital Subscribcr I Ine Access Multiplexor, DSLAM) După conversia semnalelor digitale și a fluxului de biți, se formează pachete, care sunt apoi trimise Furnizorului de servicii Internet prin cablu Multe companii de televiziune oferă utilizatorilor posibilitatea de a apela • la Internet prin intermediul reţelelor de cablu Această tehnologie este oarecum diferită de ADSL, așa că ar trebui luată în considerare separat În posesia fiecărui operator de televiziune uşoară, pe lângă sediul central, există o serie de noduri principale (Incinte cu echipamente electronice) dispersate pe întreg teritoriul ţării Toate sunt conectate la sediul central printr-un cablu de bandă largă sau optocuplat () g din fiecare nod principal, unul sau mai multe cabluri pleacă către consumatorii finali Pentru ca un astfel de cablu să fie conectat, acesta trebuie să fie amplasat în apropierea incintei în care se află utilizatorii În același timp, sute de utilizatori sunt conectați la același cablu De obicei, lățimea de bandă a unui astfel de cablu este de aproximativ MHz După cum puteți vedea, diferența conceptuală dintre accesul prin cablu și tehnologia ADSL constă în absența unui canal individual conectat la biroul furnizorului de servicii Totuși, în practică, beneficiile de a avea propriul canal cu o lățime de bandă de , MHz, pe pe de o parte, și un total de de utilizatori de canal în comun cu o lățime de bandă de MHz, pe de altă parte, sunt aproximativ echivalente (acest lucru se explică prin faptul că la un moment dat, din de utilizatori, nu mai mult de jumătate sunt în rețea) Mai mult decât atât - în toiul nopții, internetul prin cablu funcționează mult mai rapid decât în timpul zilei, în timp ce rata de transfer de date pe canalul ADSL este aceeași pe tot parcursul zilei Logica este aceasta: pentru a obține un acces optim la internet prin cablu, trebuie să locuiți fie într-o zonă foarte bogată (unde casele sunt la mare distanță unele de altele și, prin urmare, nu mulți utilizatori sunt conectați la același cablu), fie în un foarte sărac (unde nimeni nu își permite să achiziționeze un astfel de serviciu) Deoarece mai mulți utilizatori sunt conectați la un cablu, problema reală este reglarea timpului și a frecvenței consumului de lățime de bandă Pentru a înțelege cum se rezolvă această problemă, va trebui să faceți o scurtă digresiune în tehnologia televiziunii prin cablu În SUA, intervalul de frecvență - MHz este alocat pentru difuzarea canalelor prin cablu (cu toate acestea, intervalul - MHz, destinat posturilor de radio FM, este exclus din acesta) Fiecare canal ocupă MHz (inclusiv benzi de gardă pentru a preveni interferența între canalele adiacente) În Europa, pragul inferior al gamei de cablu este de MHz, iar canalele ocupă fiecare câte - MHz (din această cauză se asigură rezoluție crescută conform standardelor PAL / SECAM); în toate celelalte privințe, schema de distribuție a frecvenței este similară cu cea americană În ambele cazuri, partea inferioară a intervalului nu este utilizată pentru transmiterea semnalelor de televiziune Încercând să implementeze tehnologia de acces la Internet prin cablu, operatorii s-au confruntat cu două probleme: Cum să preveniți interferențele atunci când transmiteți date și semnal TV în același timp? Cum se organizează traficul bidirecțional cu amplificatoare unidirecționale? Soluțiile alese sunt următoarele Cablurile moderne funcționează la o frecvență mult peste MHz, ajungând la MHz sau mai mult Canalele de uplink (adică direcționate de la utilizator la headend) ocupă un interval de - MHz (în Europa este puțin mai mare), în timp ce frecvențele înalte sunt folosite pentru a transmite traficul în aval (de la headend către utilizator) (Fig ) Vă rugăm să rețineți că, deoarece semnalele TV sunt transmise exclusiv în direcția în aval, amplificatoarele în amonte pot funcționa numai în intervalul - MHz, iar amplificatoarele în aval în intervalul de MHz și mai mare Astfel, debitul celor două direcții este asimetric, deoarece intervalul din amonte este mult mai mic decât cel din aval Cu toate acestea, această împrejurare nu deranjează prea mult operatorii de cablu, întrucât traficul este transmis în mare parte utilizatorului, și nu de la acesta În cele din urmă a /M televizor MHz Frecvențele downlink Rio Alocarea frecvenței într-un sistem standard de televiziune prin cablu cu acces la Internet se termină companiile de telefonie au avut, de asemenea, succes în furnizarea de servicii DSL asimptomatice, deși nu există restricții tehnice privind uplinkul Pentru conexiunile la Internet ale utilizatorilor finali, se folosesc modemuri ka-pvlnyg Acestea sunt dispozitive cu două interfețe - pentru conectarea la un computer, pe de o parte, și la o rețea de cablu, pe de altă parte Interfața este simplă - ca și în cazul ADSL, o rețea Ethernet miniaturală este organizată pentru a transfera circuite În viitor, modemurile prin cablu vor fi • fabricate probabil ca plăci care se potrivesc în sistem, în același mod în care erau vechile modemuri telefonice Pe partea opusă, sunt instalate echipamente mai sofisticate I cabluri de conectare prin cablu este un subiect din domeniul ingineriei radio, prin urmare, în contextul scrisului, prezentarea sa detaliată este inadecvată Singurul lucru care merită este funcționarea continuă a modemurilor prin cablu - în acest sens seamănă cu modemurile ADSL Conexiunea se stabilește și se menține інм іояііno și se întrerupe numai atunci când sursa de alimentare este deconectată din cauza faptului că operatorii de rețele de cablu nu percep o taxă per time pentru serviciile lor Pentru a înțelege mai bine cum funcționează modemurile prin cablu, să aruncăm o privire la pașii implicați în conectarea și pornirea unui modem Modemul scanează mai întâi conținutul legăturilor în jos pentru un pachet special, care este trimis la intervale regulate de la headend și colectează parametrii de sistem pentru modemurile recent conectate La detectarea unui apel, modemul își anunță prezența pe una dintre legăturile în sus, iar headend-ul atribuie modemului anumite legături uplink și downlink Ulterior, dacă headend-ul consideră că este necesar să echilibreze legătura, alte canale pot fi alocate modemului Modemul determină apoi distanța până la headend, trimițându-i un pachet icial și calculând timpul de răspuns Acest proces se numește clasare Cunoscând distanța până la nodul principal, modemul poate regla funcționarea uplink-urilor în consecință Ideea este că fluxul de date din amonte este subdivizat în intervale de timp sau mini-sloturi Fiecare pachet din amonte trebuie să se încadreze în cadrul unul sau mai multe mini*slot consecutive Nodul clătite trimite în mod regulat notificări despre începutul noilor cicluri de minislot, dar deoarece modemurile sunt la distanțe diferite de nodul principal, primesc aceste notificări la momente diferite În același timp, știind cât de departe se află de nodul principal, modemul poate calcula ora reală de pornire a mini-slot Lungimea mini-slot este determinată de caracteristicile unei anumite rețele Sarcina utilă a unui mini-slot este de obicei de octeți În timpul inițializării, headend-ul leagă fiecare modem la un mini-slot specific, ceea ce îi permite să trimită cereri de lățime de bandă De obicei, mai multe modemuri sunt legate la același mini-slot, datorită căruia se formează un mecanism de dispută Înainte ca pachetul să fie trimis de la computer în rețea, acesta este trecut la modem, care apoi solicită numărul corespunzător de mini-sloturi Dacă cererea este acordată, headend-ul trimite o confirmare în aval indicând mini-sloturile rezervate pentru pachet Mai departe, pornind de la primul mini-slot rezervat, începe trimiterea Solicitările de trimitere a pachetelor suplimentare sunt încorporate într-un câmp special de antet Dacă modemul nu primește o confirmare din cauza disputei pentru mini-slot solicitat, așteaptă o perioadă de timp aleatorie și repetă cererea Cu fiecare încercare nereușită, timpul de așteptare se dublează, contribuind la scurgerea traficului intens Legăturile în jos sunt gestionate diferit În primul rând, într-o transmisie în aval, există un singur expeditor - nodul principal Prin urmare, nu există nicio dispută, precum și necesitatea de a aloca mini-slot, care, în esență, nu este altceva decât un mijloc de multiplexare statistică a diviziunii în timp În al doilea rând, traficul în aval este de obicei mult mai intens decât traficul în amonte, deci este transmis în pachete de de octeți Pachetul, pe lângă sarcina utilă de de octeți, include codul de corectare a erorilor Reed-Solomon și alte câmpuri de serviciu Această dimensiune a pachetului este aleasă pentru compatibilitatea cu televiziunea digitală MPEG- - ca urmare, canalele din aval ale semnalului de televiziune și ale datelor sunt formatate în același mod Schema logică a acestor conexiuni este prezentată în fig Cu toate acestea, să revenim la procedura de inițializare a modemului După calibrare, primire uplink și downlink și atribuire minislot-uri, modemul poate începe să transmită pachete Pachetele sunt trimise către headend, de la care merg la sediul central al operatorului de televiziune prin cablu pe un canal dedicat, iar de acolo la furnizorul de servicii de internet (ISP), în calitate de operator însuși Primul pachet trimis furnizorului de servicii conține o solicitare de a furniza în mod dinamic o adresă de rețea (adresă IP) O altă întrebare din acest pachet se referă la ora exactă a zilei Următorul pas este abordarea problemelor de securitate Mulți utilizatori își transmit datele printr-un singur cablu, prin urmare, dacă dorește, utilizatorul poate organiza interceptarea întregului trafic care trece Pentru a preveni ca vecinii să se urmărească în mod colectiv, tot traficul, indiferent de direcția în care este trimis, este obligatoriu Mbps QPSK pe mini-sloturi de octeți Rio Organizarea standard a uplink-urilor și downlink-urilor în SUA Tehnologia QAM- (Quadrature Amplitude Modulation) permite transmisia și viteza ki de biți/Hz, dar funcționează doar la frecvențe înalte QPSK (►Phase Modulation') funcționează la frecvențe joase, dar rata maximă de transmisie este de bps criptat Prin urmare, în timpul procesului de inițializare, printre altele, determină criptarea * "n până în iunie S-ar părea că negocierea cheii secrete Între modem și nodul principal sub privirea atentă a mii de utilizatori este imposibilă De fapt, nu este cazul - algoritmul Diffie-Hellman [Kaufman et al , ] este folosit pentru a determina cheia de criptare ii/іrg În cele din urmă, modemul se înregistrează în rețea și își raportează identificatorul unic pe un canal securizat În acest moment, la finalizarea procesului de inițializare, utilizatorul poate începe lucrul Recenzia dvs despre modemurile prin cablu s-a dovedit a fi destul de concisă Pentru detalii, vă rugăm să consultați literatura suplimentară [Adams și Dulchinos, ; I hmaldson și Jones, ; Dutta-Roy, ] Camere digitale Ign mai multe tehnologii informatice sunt introduse în domeniul fotografiei digitale – chiar și acum camerele digitale sunt destul de legitime pentru a le considera unul dintre tipurile de periferice de computer Să aruncăm o privire rapidă asupra modului în care funcționează Toate camerele sunt echipate cu un obiectiv, cu ajutorul multor din spatele camerei se formează o imagine a obiectului Într-o cameră tradițională, filmul acționează ca un purtător de imagini latente care se formează în momentul pătrunderii luminii Imaginile sunt dezvoltate în laborator prin expunere la anumiți reactivi chimici Principiul de funcționare al unei camere digitale este similar, cu o excepție în care purtătorul de imagine devine o matrice dreptunghiulară și circuite integrate de dispozitive sensibile cuplate cu încărcare (Charge-Coupled Devices) în loc de film Când lumina lovește un dispozitiv CCD, dispozitivul primește un șoc electric Cu cât este mai multă lumină, cu atât este mai mare schimbarea încărcăturii Încărcare citită Capitolul Organizarea sistemelor informatice convertor analog-digital ca un număr întreg de la la (la camerele cu preț redus) sau de la la (la camerele reflex digitale cu un singur obiectiv) Circuitul corespunzător este prezentat în Fig Un pixel este format pe baza valorilor a patru dispozitive CCD - unul roșu, unul albastru și două verzi Mai repede memorie Orez Camera digitala Memorie flash sau microdisc Camera digitala Fiecare dispozitiv CCD, indiferent de lumina care cade pe el, generează o singură valoare la ieșire Pentru a forma imagini color, dispozitivele CCD sunt combinate în grupuri de patru elemente Un filtru Bayer este plasat deasupra grupului, ceea ce face ca un dispozitiv CCI să fie sensibil la roșu, altul la albastru și celelalte două la verde Prezența a două elemente verzi se explică prin doi factori: în primul rând, este mai convenabil, iar în al doilea rând, ochiul uman percepe verdele mai bine decât albastrul și roșu Dacă producătorul unei camere digitale susține că rezoluția acesteia este de milioane de pixeli, să știți că acest lucru nu este adevărat Are milioane de dispozitive CCD, care împreună formează , milioane de pixeli Cu această rezoluție, imaginea este citită sub forma unei matrice de x (în camerele ieftine) sau x (în camerele reflex cu un singur obiectiv) pixeli Pixelii suplimentari sunt generați prin interpolare software Când apăsați butonul de declanșare al obiectivului, software-ul camerei efectuează trei operații: setează focalizarea, determină expunerile și efectuează echilibrarea albului Focalizarea automată este realizată prin analiza datelor de imagine de înaltă frecvență și împingerea obiectivului la limita pentru detalii maxime La determinarea expunerii, se calculează mai întâi intensitatea luminii care cade pe CCD, după care se ajustează deschiderea și viteza obturatorului astfel încât rezultatul * • intensitatea nsіgіing a scăzut la mijlocul intervalului CCD Echilibrarea ni ni și se va schimba în măsurarea spectrului luminii incidente în scopul • corectării ulterioare Imaginea generală este citită de la CCD și stocată ca o matrice de vârf la mai mulți pixeli în RAM încorporată a camerei Camere profesionale one-♦ andііініі іг SLR cu care lucrează fotojurnaliştii, ѵ і în іе'іspie cinci secunde pentru a filma opt cadre cu rezoluție înaltă »• »»ііііїdu; în același timp, cantitatea de memorie RAM încorporată în care imaginile și și sunt plasate înainte de procesarea ulterioară și stocarea permanentă, • nu aproximativ GB Camerele ieftine au mai puțină memorie RAM, dar |mnii() nu este suficient Când faceți o fotografie, software-ul efectuează corecția culorii în și în afara balansului de alb, neutralizând astfel excesul de roșu sau albastru și lumină (ceea ce apare, de exemplu, când fotografiați un subiect care este •• și nici unul, sau când utilizați un bliț) Apoi, se efectuează algoritmi pentru spălarea sub presiune și corectarea dispozitivelor CCD defecte După aceea (dacă funcția iIniiigg este activată) se încearcă creșterea clarității și înObiecție, marginile sunt căutate și intensitatea gradientului este crescută în ele I În primul rând, imaginea este comprimată pentru a reduce spațiul pe care îl ocupă • mnііі Formatul cel mai comun utilizat în acest scop este JPEG și |іani l'hotographic Experts Group — un grup comun de experți în domeniul |nіiiiirografiei) Acesta prevede o transformare spațială bidimensională a lui Foura * și eliminarea componentelor de înaltă frecvență Imaginea finală este foarte compactă, dar micile detalii se pierd C Device Control IA SUB Substitut (subscript) )(\ Controlul dispozitivului ) B ESC ESCape (Ieșire) n X Device Control IC FS File Separator NAK Negative AcKnolidgemcnt D GS Group Separator nd SYN SYNcronous inactiv (Pauză) IE RS Record Separator d/ Blocul de sfârșit de transmisie ETB F us Unit Separator Număr Simbol Număr Simbol Număr Număr Simbol Număr Simbol Număr Simbol Număr Simbol w (UTI-bel) @ P b P eu! A Q a Q II urm V R b R jl# s $ D T d T o / / o e E și e și ( & F V f V ♦ G W g W H ( H X h ) I y i y L * PENTRU • A J A Z A j A z + ZV V la V [ V k B { C g SC C L C C C ) - D = D M D D m D } : • E E N E A E n E A* // F? F O F - F O F DEL Multe caractere de control ASCII sunt destinate transmiterii de date De exemplu, un mesaj poate consta din caracterul SOH (Start of Ileader), antetul în sine, caracterul STX (Start of Text), textul în sine, ETX (End of Text) ) și în cele din urmă caracterul EOT (End of Transmission) Cu toate acestea, în practică, mesajele trimise prin linii telefonice și rețele sunt formatate diferit, astfel încât caracterele de control ASCII sunt cu greu utilizate pentru transmisie Caracterele ASCII imprimabile includ litere mari și mici, numere, semne de punctuație și unele simboluri matematice Unicode Industria calculatoarelor s-a dezvoltat predominant în SUA, rezultând un cod ASCII mai potrivit pentru engleză decât pentru alte limbi Franceza are accente, germana are umlauts și așa mai departe Unele limbi europene au câteva litere care nu sunt în setul de caractere ASCII Unele limbi au un alfabet complet diferit (cum ar fi rusă sau arabă), iar unele nu au deloc un alfabet (cum ar fi chineza) Calculatoarele s-au răspândit în întreaga lume, iar furnizorii de software doresc să-și vândă produsele nu numai în țările vorbitoare de engleză, ci și în țările în care majoritatea utilizatorilor nu vorbesc engleza și au nevoie de un set de caractere diferit Prima încercare de a extinde codul ASCII a fost standardul IS , care a adăugat încă de caractere la setul de caractere ASCII, rezultând un set de caractere de biți numit Latin-І Au fost adăugate în mare parte litere latine cu linii și semne diacritice Următoarea încercare a fost standardul IS , care a introdus conceptul de pagină de cod O pagină de coduri este un set de de caractere pentru o anumită limbă sau un grup de limbi, în IS - acesta este setul Latin-І IS - include limbi slave cu alfabet latin (de exemplu, cehă, poloneză și maghiară), IS - descrie caractere pentru turcă, malteză, galică, esperanto etc Principalul dezavantaj al acestei abordări este că software-ul Software-ul trebuie să controleze cu ce pagină de cod are de-a face, iar amestecarea limbilor este inacceptabilă De asemenea, acest sistem nu acoperă japoneză și chineză Un grup de companii de calculatoare a rezolvat această problemă prin crearea unui nou sistem de codificare numit Unicode și declarând acest sistem standard internațional (IS ) Unicode este acceptat de unele limbaje de programare (cum ar fi Java), unele sisteme de operare (cum ar fi Windows NT) și multe aplicații Este probabil ca acest sistem să se răspândească în întreaga lume Ideea de bază din spatele Unicode este de a oferi fiecărui caracter o singură valoare constantă de biți, numită punct de cod Caracterele multiocteți și caracterele wildcard nu sunt utilizate Deoarece fiecare caracter are o lungime de biți, scrierea software-ului este mult mai ușoară Deoarece caracterele Unicode au o lungime de biți, există de puncte de cod în total Deoarece toate limbile din lume au un total de aproximativ de caractere, punctele de cod sunt o resursă foarte rară care nu sunt distribuite cu mare grijă Aproximativ jumătate dintre coduri sunt deja în H|n*d , pentru acest tip de tranzistor acesta este de obicei + V Dacă Vm depășește valoarea aritmetică, tranzistorul pornește și acționează ca un conductor, tu- іyіііnv vі ііmіmіmіm semnal V (prin convenție, acesta este O B) +Vcc a b c Orez Invertor cu tranzistori (a); poarta NU ȘI ( ); NU SAU poarta (c) Este important de reținut că, dacă tensiunea V este scăzută, atunci este ridicată și invers Circuitul eni este astfel un invertor care transformă logic și /sud și logic în logic Este nevoie de un rezistor (linie întreruptă) pentru a limita curentul care trece prin tranzistor, astfel încât tranzistorul i să se ardă Trecerea de la o stare la alta durează de obicei mai puțin de / nanosecunde Pe fig , b două tranzistoare sunt conectate în serie Dacă atât tensiunea Vt, cât și tensiunea V sunt mari, atunci ambele tranzistoare devin conductori și reduc V Dacă una dintre tensiunile de intrare este scăzută, atunci tranzistorul i corespunzător se oprește și tensiunea de ieșire devine ridicată Cu alte cuvinte, V este scăzut dacă și numai dacă atât V, cât și V sunt mari Pe fig , două tranzistoare sunt conectate în paralel Dacă una dintre intrări este ridicată, tranzistorul corespunzător pornește și reduce ieșirea Dacă ambele tensiuni de intrare sunt scăzute, atunci tensiunea de ieșire devine ridicată Aceste trei circuite formează trei porți simple Ele sunt numite porți NOT, NAND și, respectiv, NOR Porțile NU sunt adesea denumite invertoare Vom folosi ambii termeni Dacă acceptăm convenția conform căreia tensiunea înaltă (Vgg) este un logic și tensiunea joasă („masa”) este un logic, atunci putem exprima valoarea la ieșire în funcție de intrare valorile pufului Pictogramele care sunt folosite pentru a descrie aceste trei tipuri de supape sunt prezentate în fig și c Acolo sunt prezentate și modurile de funcționare ale funcției pentru fiecare schemă În aceste figuri, A și B sunt semnale de intrare, X este semnalul de ieșire Fiecare rând de tabel definește un semnal de ieșire pentru diferite combinații de semnale de intrare A X Și în X Și în X în X Și în X A b c d e Orez Pictograme pentru reprezentarea celor cinci supape principale Moduri de funcționare pentru fiecare supapă Dacă semnalul de ieșire din Fig , b alimentează invertorul, obținem un alt circuit opus porții NAND, adică un astfel de circuit în care semnalul de ieșire este dacă și numai dacă ambele semnale de intrare sunt Un astfel de circuit se numește poartă AND; reprezentarea sa schematică și descrierea funcției corespunzătoare sunt date în fig , d În mod similar, o poartă NOR poate fi conectată la un invertor Apoi obținem un circuit al cărui semnal de ieșire este egal cu dacă cel puțin unul dintre semnalele de intrare este unitate și egal cu dacă ambele semnale de intrare sunt glonț O imagine a acestui circuit, care se numește o poartă SAU, precum și o descriere a funcției corespunzătoare, sunt date în fig , e Cercurile mici din circuitele invertorului, porții NAND și porții NOR sunt numite ieșiri inversoare Ele pot fi folosite și în alte contexte pentru a se referi la un semnal inversat Cele cinci supape prezentate în fig formează baza nivelului logic digital Ar trebui să fie clar din discuția de mai sus că porțile NAND și NOR necesită câte doi tranzistori fiecare, iar porțile AND și OR necesită câte trei tranzistoare Din acest motiv, multe computere folosesc porți NAND și NOR mai degrabă decât porți AND și OR (În practică, toate porțile sunt construite oarecum diferit, dar porțile NAND și NOR sunt oricum mai simple decât AND și SAU ) Trebuie menționat că porțile pot avea mai mult de două intrări În principiu, o poartă NAND, de exemplu, poate avea un număr arbitrar de intrări, dar în practică, de obicei, nu există mai mult de opt Deși proiectarea supapelor este la nivelul dispozitivelor fizice, vom menționa în continuare principalele linii de tehnologii de fabricație, deoarece acestea sunt adesea menționate în literatură Cele două tehnologii principale sunt bipolare și MOS (metal, oxid, semiconductor) Tehnologiile bipolare includ TTL (logica tranzistor-tranzistor), care a servit drept bază pentru electronica digitală de mulți ani, și ECL (emitter-coupled) porţi şi ouleva algeora | B), care este utilizat în cazurile în care sunt necesare operațiuni de mare viteză În ceea ce privește circuitele de calcul, MES este mai comună -neptile sunt mai lente decât TTL și ESL, dar consumă mult mai multă energie și ocupă mult mai puțin spațiu, astfel încât să poți pune un număr mare de astfel de supape într-o manieră compactă Supapele MOS sunt disponibile într-o varietate de varietăți: MOS cu canal p, MOS cu canal p și MOS complementar Deși MOSFET-urile nu sunt proiectate ca Histori bipolari, ele pot funcționa și ca comutatoare electronice, alte procesoare și memorie sunt cel mai adesea fabricate folosind MOSFET-uri complementare, care funcționează la - V ota-B Atât ce putem spune despre nivel a dispozitivelor fizice ■GGyp •li care doresc să afle mai multe despre acest nivel se pot referi la litera-Mg furnizată pe site-ul cărții Lea Algebra Pentru a descrie circuite obținute prin combinarea diferitelor porți, aveți nevoie de un tip special de algebră în care toate variabilele și funcțiile pot lua doar valori: și O astfel de algebră se numește booleană Ea este numită după Matematicianul englez George Boole ( - ) De fapt, în acest tutorial vorbim despre un tip special de algebră booleană, și anume, algebra circuitelor re-Multi, dar termenul „algebră booleană” este foarte des folosit în sensul „Shіgebra circuitelor relee”, deci nu vom face distincție între ele La fel ca algebra obișnuită (adică cea care se studiază la școală), CLITBR boolean are propriile sale funcții O funcție booleană ia una sau mai multe variabile ca intrare și produce un rezultat care depinde doar de valorile acelor Do|m'mends Se poate defini o funcție simplă / spunând că f(A) = dacă A - și f(A) = dacă A = O astfel de funcție ar fi o funcție NOT (vezi Fig , a) Deoarece o funcție booleană de n variabile are doar combinații posibile de valori variabile, o astfel de funcție poate fi descrisă complet printr-un tabel cu n rânduri Fiecare linie va da valoarea funcției pentru diferite combinații de valori variabile Un astfel de tabel se numește tabel de adevăr Toate tabelele din fig sunt tabele de adevăr Dacă suntem de acord să aranjam întotdeauna rândurile tabelului de adevăr în ordine numerică, adică pentru două variabile în ordinea , , , AND, atunci funcția poate fi complet descrisă printr-un număr binar de ”biți, care este obţinute prin citirea verticală a coloanei rezultat din adevărul tabelului Astfel, NAND este , NOR este , AND este și OR este Evident, există doar funcții booleene a două variabile, care corespund la șiruri posibile de biți În algebra obișnuită, dimpotrivă, există un număr infinit de funcții a două variabile și niciuna dintre ele nu poate fi descrisă printr-un tabel de valori ale acestei funcții pentru toate valorile admisibile ale variabilelor de intrare, deoarece fiecare variabilă poate lua un număr infinit de valori Pe fig , a arată tabelul de adevăr pentru o funcție booleană a trei variabile: M = f(A, Bt C) Aceasta este funcția majoritară, care ia Valoarea este dacă majoritatea variabilelor sunt , sau dacă majoritatea variabilelor sunt Deși orice funcție booleană poate fi definită folosind un tabel de adevăr, acest tip de notație devine greu de utilizat pe măsură ce numărul de variabile crește Prin urmare, în loc de tabele de adevăr, este adesea folosită o altă notație A în cu m A b Orez Tabelul de adevăr pentru funcția majoritară a trei variabile (a); schema de implementare a acestei funcții (b) Pentru a vedea acest alt tip de notație, rețineți că orice funcție booleană poate fi definită și prin specificarea combinațiilor de valori ale variabilelor de intrare care au ca rezultat o singură valoare a funcției Pentru funcția din fig , dar există combinații de variabile care dau o singură valoare a funcției Vom desena o bară peste variabilă pentru a indica faptul că valoarea acesteia este inversată Absența unei liniuțe înseamnă că valoarea variabilei nu este inversată În plus, vom folosi semnul de înmulțire (punct) pentru a reprezenta funcția booleană AND (acest semn poate fi omis) și semnul de adunare (+) pentru a reprezenta funcția booleană SAU De exemplu, ABC este numai dacă A = , B = și C = De asemenea, AB + BC este numai dacă (L = și B = ) sau (B = și C = ) În tabelul din fig , iar funcția ia valoarea în patru linii: ABC, ABC, ABC și ABC Funcția M la- ia o valoare adevărată (adică ) dacă una dintre aceste patru condiții este adevărată Eu 'іі'adovatelyіo, putem scrie M = ABC + ABC + ABC + ABC Aceasta este o notație compactă a tabelului de adevăr Astfel, o funcție de n variabile poate fi descrisă printr-o „suma” de cel mult L „produse”, iar fiecare „produs” va avea n factori După cum vom vedea în scurt timp, această formulare este deosebit de importantă deoarece permite implementarea acestei funcții folosind porți standard Este important să înțelegem diferența dintre o funcție booleană abstractă și implementarea ei cu un circuit electronic O funcție booleană constă din variabile precum L, B și C, precum și din operatori AND, OR și NOT O funcție booleană este evaluată folosind un tabel de adevăr sau o notație specială, de exemplu: F - ABC + ABC O funcție booleană poate fi implementată de un circuit electronic (adesea în diferite moduri) folosind semnale care reprezintă variabile de intrare și ieșire și porți precum AND, OR și NOT Implementarea funcţiilor booleene Kick a remarcat mai devreme că reprezentarea unei funcții booleene ca o sumă de cel mult n produse duce direct la o posibilă implementare a celei de-a doua funcții Pe fig , b, semnalele de intrare L, B și C sunt afișate în partea stângă, funcția L / obținută la ieșire este afișată în dreapta Deoarece variabilele de intrare trebuie inversate, semnalul trece prin invertoarele , și Pentru a clarifica figura, am trasat linii verticale, dintre care sunt asociate cu variabilele de intrare, altele cu inversiunile acestora Aceste linii furnizează semnal de intrare ig|M'ing către porți De exemplu, porțile , și primesc un semnal A la intrarea lor Într-un circuit real, aceste porți ar fi probabil conectate direct la A fără fire verticale între ele Circuitul conține patru porți AND, câte una pentru fiecare termen din ecuația pentru M (adică una pentru fiecare rând din tabelul de adevăr cu un rezultat de ) Fiecare poartă AND evaluează unul dintre rândurile specificate ale tabelului de adevăr În final, toate aceste produse sunt însumate (adică operația SAU) pentru a obține rezultatul final I (uitați-vă la Fig , b În această carte vom folosi următoarea convenție: dacă două linii din figură se intersectează, conexiunea este implicită numai dacă există un punct aldine la intersecție De exemplu, ieșirea supapei traversează toate cele linii verticale, dar este legat doar de linia C () Rețineți că alte cărți pot folosi convenții diferite Din fig ar trebui să fie clar cum să obțineți schema pentru orice funcție booleană: Faceți un tabel de adevăr pentru această funcție Includeți invertoare în circuit pentru a putea inversa fiecare semnal de intrare Desenați o poartă AND pentru fiecare rând al tabelului de adevăr cu rezultatul Conectați porțile AND la semnalele de intrare corespunzătoare Ieșiți ieșirile tuturor porților AND și direcționați-le către intrarea porții SAU Am arătat cum să implementăm orice funcție booleană folosind porțile NOT, AND și OR Cu toate acestea, este mult mai convenabil să construiți circuite folosind un singur tip de poartă Din fericire, circuitele construite conform algoritmului anterior sunt ușor convertite în formă NAND sau NOR Tot ceea ce este necesar pentru a implementa o astfel de transformare este implementarea porților NOT, AND și OR folosind orice tip de poartă Pe fig arată cum să faceți acest lucru pe baza porților NAND sau NOR (Această conversie este elementară, dar există și alte opțiuni ) b c Orez Construcția porților NOT (a), AND (b) și OR (c) numai pe baza porților NAND sau NOR Pentru a implementa o funcție booleană bazată doar pe porți NAND sau NOR, puteți urma mai întâi algoritmul descris prin construirea unui circuit cu porți NOT, AND și OR Apoi, trebuie să înlocuiți supapele cu mai multe porturi cu circuite echivalente pe ventile cu două porturi De exemplu, A + B + C + D poate fi schimbat în (A + B) + (C + D) folosind trei porți cu două sensuri Apoi porțile NOT, AND și OR sunt înlocuite cu circuitele prezentate în fig Deși această procedură nu conduce la circuite optime în ceea ce privește numărul minim de porți, ea demonstrează că o astfel de transformare este fezabilă Porțile NAND și NOR sunt considerate complete deoarece există porți și algebră booleană Funcția poate fi implementată pe baza lor Nicio altă supapă nu are această proprietate, motiv pentru care aceste două tipuri de supape sunt preferate la construirea circuitelor schemă lentitudine Proiectanții de circuite încearcă adesea să reducă numărul de porți pentru a reduce spațiul curent ocupat de circuit, a reduce consumul de energie etc supape simple, de exemplu, cu două căi cu patru căi) Algebra booleană este un instrument valoros în schemele per-valente Ca exemplu de utilizare al algebrei booleene, luați în considerare schema și tipurile ta pentru funcția AB + AC (Fig , a) Deși nu suntem încă siguri, multe dintre regulile algebrei generale se aplică și algebrei booleene ), expresia AB + AC conform legii distributive poate fi transformată în B + C) Pe fig , b arată schema și tabelul de adevăr pentru o funcție Două funcții sunt echivalente dacă și numai dacă ambele funcții iau aceeași valoare pentru toate variabilele posibile Dintre cele blitz-uri de adevăr din Fig arată clar că funcția A(JB + C) este echivalentă cu funcția AB + AC În ciuda acestei echivalențe, circuitul din Fig , b este mai simplu decât circuitul din fig a, deoarece conține mai puține porți A c AB AC AB + AC A în c A în + c A (B + C) a b Orez Două funcții echivalente: AB + AC (a); A(B + C) (b) iwv ilaaa i CIFRIVIA NIVEL LEGIC De obicei, un dezvoltator pornește de la o anumită funcție booleană și apoi îi aplică legile algebrei booleene pentru a găsi o funcție mai simplă echivalentă cu cea originală Pe baza funcției obținute se poate construi sistem Pentru a utiliza această abordare, trebuie să cunoașteți câteva relații (legi) ale algebrei booleene, care sunt prezentate în tabel Este interesant de observat că fiecare raport are două forme O formă poate fi derivată din alta; schimbând AND la SAU și la Toate relațiile pot fi dovedite cu ușurință prin compilarea tabelelor lor de adevăr În aproape toate cazurile, rezultatele sunt clare, cu excepția relației De Morgan, a relației de absorbție și a relației de distribuție Relația lui De Morgap poate fi extinsă la expresii cu mai mult de două variabile, cum ar fi ABC = A + B + C Tabelul Câteva relații de algebră booleană Raport ȘI SAU Relația de identitate IA \u d A + A \u d A Raportul zero OA = + A = Relația de neputință AA = A A + A = A Raportul de inversiune AA = A +Â= Relația de comutativitate AB = BA A + B = B + A Raport asociativ (AB)C \u d A (BC) (A + B) + C \u d A + (B + C) Relația de distribuție A + BC = (A + B)(A + C) A(B + C) = AB + AC Raportul de absorbție A(A + B) = A A + AB = A Raportul lui De Morgan AB = A + B A + B = AB Raportul lui De Morgan sugerează o notație alternativă Pe fig , iar forma AND este dată cu negație, care este prezentată folosind intrări și ieșiri inversate Astfel, o poartă SAU cu intrări inversate este echivalentă cu o poartă NAND Din fig b, care ilustrează a doua formă a relației De Morgan, este clar că în loc de o poartă NOR, se poate desena o poartă AND cu intrări inversate Prin negarea ambelor forme ale relației De Morgan, ajungem la reprezentări echivalente ale porților AND și OR (Fig , c, d) Reprezentări simbolice similare există pentru diferite forme ale relației De Morgan (de exemplu, o poartă NAND cu intrare w devine o poartă SAU cu intrări inversate) Folosind ecuațiile prezentate în fig și ecuații similare pentru porțile cu mai multe intrări, se poate converti cu ușurință suma produselor în forma numai de porți NAND sau numai de porți NOR Ca exemplu, luați în considerare funcția SAU EXCLUSIV (Fig , a) Schema standard care exprimă suma produselor este prezentată în fig b Pentru a ajunge la forma NAND, trebuie să desenați linii care conectează ieșirile porților AND cu intrarea porții SAU, cu intrări și ieșiri inversoare, ca AB A+B A+B Orez Reprezentări alternative ale unor porți: NAND (a); NU-SAU (b); Si in); SAU (g) ін»к;і іаі i() în fig , c Apoi, pe baza fig , a, ajungem la fig , d Variabilele A și B pot fi obținute din L și B folosind porți NAND sau III' PLI cu intrări combinate Rețineți că intrările (ieșirile) inversoare se pot deplasa opțional de-a lungul liniei de comunicație, de exemplu, de la ieșirile porții de intrare la intrările porții de ieșire A B XOR A în g Orez Tabel de adevăr pentru funcția SAU EXCLUSIV (a) Trei scheme pentru calcularea acestei funcții (b-d) Rămâne de remarcat faptul că aceeași poartă fizică poate calcula diferite funcții în funcție de convențiile utilizate Pe fig și am arătat semnalele de ieșire ale porții F pentru diferite combinații de semnale de intrare Atât semnalele de intrare, cât și de ieșire sunt date în volți Dacă acceptăm („convenția conform căreia V este un zero logic și , V sau V este unul logic, obținem tabelul de adevăr prezentat în Fig , , adică funcția AND Un astfel de acord se numește logică pozitivă Cu toate acestea, dacă acceptăm logica negativă, adică suntem de acord că OB este o unitate logică și , V sau V este un zero logic, atunci vom obține tabelul de adevăr prezentat în Fig , c, adică, funcția SAU În F s s s s ov V OV V V V V V V A A la F b în F în Orez Caracteristicile electrice ale dispozitivului (a); logica pozitiva (b); logica negativa (c) Astfel, totul depinde de ce convenție este aleasă pentru afișarea tensiunilor în mărimi logice În această carte, ne vom limita în mare parte la logica pozitivă, astfel încât termenii „boolean ”, „adevărat” și „mare” sunt considerați sinonimi, la fel ca termenii „boolean ”, „fals” și „scăzut” Circuite logice digitale de bază Acum știm cum să implementăm tabele de adevăr și să construim circuite simple din porți individuale În practică, circuitele logice digitale sunt foarte rar construite poartă cu poartă, deși această abordare a fost cândva obișnuită Acum, blocurile standard de „construcții” sunt module care combină mai multe supape În următoarele subsecțiuni, ne vom uita la aceste blocuri de construcție mai detaliat și vom vedea cum sunt utilizate și cum să le construim din porți individuale circuite integrate Supapele nu sunt fabricate și vândute individual, ci în module numite circuite integrate (CI) sau microcircuite Un circuit integrat este o bucată pătrată de siliciu, a cărei dimensiune depinde de numărul de porți necesare implementării componentelor Circuitele integrate mici sunt de obicei în jur de mm x mm, cele mai mari pot fi în jur de mm x mm Microcircuitele sunt de obicei plasate în pachete de plastic sau ceramică dreptunghiulare semnificativ mai mari dacă microcircuitul necesită mulți pini pentru a comunica cu lumea exterioară Fiecare pin este conectat la intrarea sau ieșirea unei porți, la o sursă de alimentare sau la masă circuite logice digitale de bază ■і Nm fig prezintă câteva opțiuni comune pentru pachetele ■Mroschem Pentru microcircuite mici (de exemplu, cele utilizate în microcontrolere sau circuite de memorie), se folosesc pachete Dual Inline Package (DIP) - pachete cu două rânduri de Cmvod-uri introduse în prizele corespunzătoare de pe placa de bază De obicei, DIP-uri cu , , , , , , , , sau de pini Pentru circuitele mari ISC, se folosesc adesea pachete, în care cablurile sunt amplasate pe cele patru laturi sau de jos Două pachete comune pentru circuitele integrate mai mici sunt PGA (Pin Grid Argy) și LGA (Land Grid Argal) Pentru carcasele PGA, pinii sunt localizați în partea de jos a carcasei și sunt incluși în pinii corespunzători de pe placa de bază Prizele PGA folosesc adesea un mecanism de forță de inserție zero; cu alte cuvinte, PGA alunecă în priză fără efort, după ce împingerea pârghiei aplică presiune pe toți pinii PGA, iar micro-eChem-ul este ținut ferm în priză Cipurile LGA au plăcuțe de contact pe suprafața inferioară a MPUS-ului, iar soclu-ul LGA are un capac, care presează cipul pe placă și asigură contactul între plăcuțele LGA și plăcuțele soclului în Iisus Principalele tipuri de pachete pentru circuite integrate: DIP (a), PGA ( } și LGA (s) Pachetele de cipuri au adesea o formă simetrică, așa că atunci când le instalați, există întotdeauna probleme cu alegerea orientării Pachetele DIP au de obicei o crestătură pe o parte, care ar trebui să corespundă semnului de pe soclul - P Pachetele PGA nu au de obicei un pin, așa că o încercare de a introduce incorect un PGA într-un soclu este sortită eșecului Deoarece pachetele LGA nu au pini, instalarea corectă este asigurată prin plasarea crestăturilor pe una sau ambele părți ale LGA Dacă crestăturile nu se potrivesc cu cheile din soclul LGA, cipul nu se va potrivi în soclu Pentru comoditate, presupunem că ieșirea porții se schimbă de îndată ce semnalul de la intrarea acesteia se schimbă De fapt, există o anumită întârziere de poartă, care include timpul de trecere a semnalului prin microcircuit și timpul de comutare Latența este de obicei de la sute de picosecunde la câteva nanosecunde Acum este posibil să puneți până la miliard de tranzistori pe un singur cip Deoarece orice circuit poate fi construit din porți NAND, s-ar putea avea impresia că producătorul este capabil să facă Nu uita de legea lui Moore Miezul procesorului Pentium IV conține deja de milioane de tranzistori și evident, aceasta nu este limita - Notă științific ed io>» ilvv □ logica digitala nivelul un microcircuit care conține de porți NAND mototolite Din păcate, pentru a crea un astfel de microcircuit, sunt necesari de pini Întrucât distanța standard între pini este de mm, cipul LGA va avea o lungime de peste m, ceea ce este susceptibil să-i afecteze negativ capacitatea de comercializare De aceea, pentru a profita de această tehnologie, este necesar să se dezvolte circuite în care numărul de porțile depășesc semnificativ numărul de pini În următoarele subsecțiuni, ne vom uita la microcircuite simple * în care, pentru a calcula o anumită funcție, mai multe porți sunt conectate între ele într-un anumit mod, ceea ce ne permite să reducem numărul de pini externi Scheme combinatorii Multe aplicații ale logicii digitale necesită circuite cu mai multe intrări și mai multe ieșiri în care semnalele de ieșire sunt determinate de semnalele de intrare curente O astfel de schemă se numește combinatorie Nu toate schemele au această proprietate De exemplu, un circuit care conține elemente de memorie poate genera semnale de ieșire care depind de valorile stocate în memorie Un microcircuit care implementează un tabel de adevăr (de exemplu, prezentat în Fig , a) este un exemplu tipic de circuit combinatoriu În această secțiune, vom analiza cele mai frecvent utilizate scheme combinatorii Multiplexoarele La nivel logic digital, multiplexorul este un circuit cu L intrări, o ieșire și n linii de control care vă permit să selectați una dintre intrări Intrarea selectată este conectată la ieșire Pe fig prezintă o diagramă a unui multiplexor cu opt intrări Cele trei linii de control A, B și C codifică un număr de biți care specifică care dintre cele opt linii de intrare trebuie conectată la poarta SAU și, prin urmare, la ieșire Indiferent de valoarea pe liniile de control, șapte porți AND vor scoate întotdeauna , iar cea rămasă poate scoate sau , în funcție de valoarea liniei de intrare selectate Fiecare poartă AND este declanșată de o combinație specifică de semnale pe liniile de control Circuitul multiplexor este prezentat în fig Folosind un multiplexor, putem implementa funcția majoritară (vezi Figura a) așa cum se arată în Figura b Pentru fiecare combinație de A, B și C, se selectează una dintre liniile de intrare Fiecare intrare este conectată fie la semnalul V (logic ), sau cu masă (logic ) Algoritmul conexiunii de intrare este foarte simplu: intrarea Dt este aceeași cu valoarea din rândul i al tabelului de adevăr Pe fig , iar în liniile , , și valoarea funcției este , deci intrările corespunzătoare sunt împământate; în rândurile rămase, valoarea funcției este , deci intrările corespunzătoare sunt conectate la una logică În acest fel, pe baza microcircuitului din Fig , dar puteți implementa orice tabel de adevăr cu trei variabile Am văzut deja cum poate fi folosit un multiplexor pentru a selecta una dintre mai multe intrări și cum permite construirea unui tabel de adevăr Este de asemenea circuite logice digitale ionice ii Orez Diagrama unui multiplexor cu opt căi A Vcc b Orez Multiplexor cu opt intrări (a); același multiplexor montat pentru a calcula funcția majoritară (b) poate fi folosit ca convertor paralel-serial Dacă aplicați biți de date liniilor de intrare și apoi comutați alternativ liniile de control pentru a obține valori de la OOO la (acestea sunt numere binare), atunci biți vor merge la linia de ieșire în serie În mod obișnuit, această conversie se realizează la introducerea informațiilor de la tastatură, deoarece fiecare apăsare de tastă determină un număr de sau biți care ar trebui transmis secvenţial prin linia telefonică Opusul unui multiplexor este un demultiplexor, care conectează un singur semnal de intrare la una dintre ieșirile de ", în funcție de valorile semnalelor din cele n linii de control Dacă valoarea binară a liniilor de control este k, atunci ieșirea k este selectată Decodoare Ca un al doilea exemplu, luați în considerare un circuit care ia un număr de n biți ca intrare și îl folosește pentru a selecta (adică, setat la ) una dintre cele n linii de ieșire Un astfel de circuit se numește decodor Un exemplu de decodor pentru n = este prezentat în fig Orez Schema unui decodor care conține intrări și Ѳ ieșiri Pentru a înțelege de ce este nevoie de un decodor, imaginați-vă o memorie formată din opt cipuri, fiecare conținând MB Cipul are adrese de la la MB, cipul are adrese de la la MB și așa mai departe Cei mai importanți trei biți ai adresei sunt utilizați pentru a selecta unul dintre cele opt cipuri Pe fig acești trei biți sunt cele trei intrări I, B și C În funcție de semnalele anodice, exact una dintre cele opt linii de ieșire (Do, /> ) primește shnchgiiis ; liniile rămase iau valoarea Fiecare linie de ieșire induce unul dintre cele opt cipuri de memorie Deoarece o singură linie este setată la , este activat un singur cip Principiul de funcționare al circuitului prezentat în Fig nu este dificil Fiecare ven-inii Și are trei intrări, dintre care prima este A sau L, a doua este B sau B, repet C sau (? Fiecare poartă este declanșată de o combinație diferită de intrări: /> (| combinație de A B C, Di - combinație de A B C și etc Comparatoare Un alt circuit util este un comparator Comparatorul compară două cuvinte care sunt introduse Comparatorul prezentat în fig ia două intrări A și B de biți fiecare și iese dacă sunt egale și dacă stps-urile nu sunt egale Circuitul se bazează pe o poartă EXCLUSIVĂ SAU care scoate dacă intrările sunt egale și dacă intrările nu sunt egale Dacă toate cele patru cuvinte de intrare sunt egale, toate cele patru porți SAU EXCLUSIVE ar trebui să iasă Aceste patru semnale sunt apoi introduse în poarta SAU Dacă rezultatul este , atunci cuvintele de intrare sunt egale; si in rest nu sunt egali În exemplul nostru, am folosit o poartă OR ca finală pentru a schimba valoarea rezultatului: I înseamnă egal, înseamnă inegalitate Exclusiv-sau poarta ao În Orez Comparator simplu pe biți Scheme aritmetice Să trecem de la scheme de uz general la scheme combinatorii, care sunt folosite pentru a efectua operații aritmetice Reamintim că pentru circuitele combinaționale, starea ieșirilor este o funcție de starea semnalului de intrare lov, dar circuitele folosite pentru a efectua operații aritmetice nu au această proprietate Vom începe cu un simplu shifter de biți, apoi ne uităm la structura sumătorilor și, în final, vom privi unitățile logice aritmetice, care joacă un rol esențial în orice computer Scheme de forfecare Primul circuit aritmetic pe care îl vom analiza este circuitul de schimbare cu intrări și ieșiri (Figura ) Opt biți de intrare sunt dați pe liniile , Dr Datele de ieșire, care sunt datele de intrare deplasate cu un bit, sunt alimentate pe liniile , , Sr Linia de control C determină direcția deplasării: - stânga, - corect O schimbare la stânga inserează un în bitul În mod similar, o schimbare la dreapta inserează o valoare de în bitul Do Di D D D D De D Deci S S S S S Se S Orez Schema de schimburi Pentru a înțelege cum funcționează un astfel de circuit, luați în considerare perechile de porți AND (cu excepția celor extreme) Dacă C = , membrul drept al fiecărei perechi este pornit, trecând bitul corespunzător prin el însuși Deoarece poarta ȘI dreapta este conectată la intrarea porții SAU, care este situată în dreapta acestei porți ȘI, are loc o deplasare la dreapta Dacă C \u d , poarta ȘI stânga a perechii este activată, apoi are loc o deplasare la stânga Aditivi Un computer care nu poate adăuga numere întregi este practic de neconceput Prin urmare, circuitul pentru efectuarea operațiilor de adăugare este o parte esențială a oricărui procesor Tabelul de adevăr pentru adăugarea numerelor întregi cu o singură cifră este prezentat în fig a Există două rezultate aici: suma variabilelor de intrare A și B și un transfer la următoarea poziție (stânga) Circuitul de calcul al bitului de sumă și al bitului de transport este prezentat în fig b Un astfel de circuit este de obicei numit semi-adunator Jumătatea de adunare este potrivită pentru adăugarea biților inferiori ai două cuvinte cu mai mulți biți Cu toate acestea, nu este potrivit pentru adăugarea de biți în mijlocul unui cuvânt, deoarece nu poate fi transportat în acea poziție Prin urmare, un complet Exclusiv-sau poarta Sumă Transfer Orez Tabel de adevăr pentru adăugarea numerelor dintr-o singură cifră (a); circuit semirumator (b) i^mmmtor (Fig ) Ar trebui să fie clar din diagramă că sumatorul complet este format din două jumătăți de sumatori Suma este egală cu dacă transferul unui număr impar de variabile A, B și nu ia valoarea (adică dacă una dintre cele trei sau toate trei este egală cu unul) Ieșirea de transfer este setată la dacă fie A și B ndHiii reme sunt (intrarea din stânga la poarta SAU) sau unul dintre ele este și ziua) de transfer este, de asemenea, Cele două jumătăți de sumare generează ambii biți de sumă, Eu port biți Intrare B Transfer în Sumă Transfer Out transfer a b Orez Tabelul de adevăr pentru sumatorul complet (a); circuit adunator complet ( ) Pentru a construi un sumator, de exemplu, pentru două cuvinte de biți, trebuie să duplicați circuitul prezentat în Fig ori b Transportul se face spre bitul adiacent stâng Un transfer la bitul din dreapta este conectat la Un astfel de sumator se numește un sumător de transfer Adăugarea la numărul ns va fi efectuată până când transportul merge până la capăt de la bitul din dreapta la cel din stânga Există sumatoare mai rapide care funcționează fără această întârziere Desigur, li se acordă preferință Luați în considerare un exemplu de adăugare mai rapidă Să împărțim sumatorul pe de biți în două jumătăți: pe biți inferioară și pe biți superioară Când începe adăugarea, sumatorul superior nu poate începe încă să funcționeze, deoarece nu cunoaște valoarea transportului și nu va putea afla până când nu se fac însumări în sumatorul inferior Cu toate acestea, puteți face o singură modificare a schemei În loc de un sumator superior, puteți obține două sumatoare superioare prin duplicarea părții corespunzătoare a echipamentului Apoi circuitul va fi format din trei sumatoare pe biți: unul inferior și două superioare [ și VV] care funcționează în paralel Ca transfer, intră în sumatorul , iar intră în sumatorul Ul Ambele sumatoare superioare încep să lucreze simultan cu sumatorul inferior, dar numai unul dintre rezultatele însumării celor doi sumatori superioare va fi corect După adăugarea celor cifre inferioare, valoarea transferului către suma superioară devine cunoscută, iar apoi poate fi determinat răspunsul corect Cu această abordare, timpul de adăugare se reduce la jumătate Un astfel de adunator este numit un adunator carry-select Puteți împărți din nou fiecare sumator pe biți în două sumătoare pe biți și așa mai departe Unități aritmetice logice Majoritatea calculatoarelor conțin un singur circuit pentru efectuarea operațiilor AND, SAU și adunare pe două cuvinte mașină De obicei, acest circuit pentru cuvintele //-bit constă din n circuite identice, câte unul pentru fiecare poziţie de bit Pe fig prezintă un astfel de circuit, care se numește unitate logică aritmetică (ALU) Acest dispozitiv poate calcula una dintre următoarele funcții: A AND B, A SAU B, B sau A + B Alegerea funcției depinde de ce semnale sunt recepționate pe liniile B () și F}: , , sau Și (în sistemul de numere binar) Rețineți că aici A + B înseamnă suma aritmetică a lui A și B, nu operația logică AND În colțul din stânga jos al circuitului este un decodor pe doi biți care generează semnale de pornire pentru patru operațiuni Alegerea funcționării este determinată de semnalele de control B() și Fv În funcție de valorile lui Bo și F^, se selectează una dintre cele patru linii de activare, iar apoi semnalul de ieșire al funcției selectate trece prin ultima SAU poarta În colțul din stânga sus al diagramei se află un dispozitiv logic pentru calcularea funcțiilor A ȘI B, A SAU B și B, dar doar unul dintre aceste rezultate trece prin ultima poartă SAU, în funcție de care dintre liniile de activare a ales decodorul Deoarece exact una dintre ieșirile decodorului poate fi , exact una dintre cele patru porți AND se va declanșa Cele trei porți rămase vor scoate indiferent de valorile lui A și B dispozitiv logic Transfer de intrare Ieșire transfer Orez Un singur bit ALU ALU poate efectua nu numai operații logice și aritmetice asupra variabilelor L și B, ci și să le facă egale cu zero prin negarea ENA (enable signal A) sau ENB (enable signal B) De asemenea, puteți obține A setând semnalul INVA (inversează A) De ce sunt necesare ENA, ENB și INVA, vom vedea în Capitolul În condiții normale, atât ENA, cât și ENB sunt pentru a permite ambele intrări, iar INVA este În acest caz, A și B merg pur și simplu la logica unitate fără modificări În colțul din dreapta jos este o sumătoare completă pentru calcularea sumei A și /J, precum și pentru efectuarea transferurilor Semnificațiile sunt necesare deoarece mai multe astfel de circuite pot fi conectate pentru a efectua operații pe cuvinte întregi Circuite cu un singur bit precum cel prezentat în Fig sunt numite secțiuni de microprocesor R-row Acestea permit dezvoltatorului să construiască un ALU de orice capacitate Pe fig prezintă o diagramă a unei ALU pe biți, compusă din opt secțiuni pe un singur bit Semnalul INC (incrementare cu unu) este necesar doar pentru operațiuni de adăugare Face posibilă calcularea sumelor albastre precum A + și A + B + transfer transfer Orez Opt secțiuni cu un singur bit conectate pentru a forma un ALU de biți Pentru a simplifica circuitul, semnalele de activare și inversare nu sunt afișate I În urmă cu câțiva ani, o secțiune cu un singur bit era un adevărat cip pe care îl puteai cumpăra În zilele noastre, este mai mult o bibliotecă pe care designerul de cipuri o dublează de câte ori este necesar în software-ul CAD; programul produce un fișier de ieșire care controlează echipamentul de fabricare a cipurilor Cu toate acestea, ideea generală a rămas neschimbată Generatoare de ceas În multe circuite digitale, totul depinde de ordinea operațiilor Uneori o operație trebuie să precedă alta, alteori două operații trebuie să aibă loc în același timp Pentru a controla parametrii de sincronizare, generatoarele de ceas sunt încorporate în circuitele digitale pentru a asigura sincronizarea Un generator de ceas este un circuit care provoacă o serie de impulsuri Toate impulsurile au aceeași durată Intervalele dintre impulsurile succesive sunt de asemenea aceleași Intervalul de timp dintre începutul unui impuls și începutul următorului se numește timp takt Frecvența pulsului este de obicei între MHz și GHz, corespunzând unui ciclu de ceas de până la ps Frecvența oscilatorului ceasului este de obicei controlată de un oscilator cu cristal de înaltă precizie Multe lucruri se pot întâmpla într-un computer într-un singur ciclu de ceas Dacă urmează să fie efectuate într-o anumită ordine, atunci măsura ar trebui împărțită în subcicluri Pentru a obține o rezoluție mai bună decât ceasul principal, trebuie să ramificați linia principală a ceasului și să introduceți un circuit cu un anumit timp de întârziere Așa se generează un semnal secundar al generatorului de ceas, defazat față de cel primar (Fig , a) Diagrama de timp prezentată în fig , b, oferă patru puncte de origine pentru evenimente discrete: Front Cr Declin în Cr Fata C Recesiune C Prin asocierea diferitelor evenimente cu diferite scăderi (fronturi și recesiuni), puteți realiza succesiunea dorită de acțiuni Dacă sunt necesare mai mult de patru puncte de referință în pre-/|gchih a unui ciclu, mai multe ramuri pot fi făcute din linia principală cu timpi de întârziere diferiți A b II) III III în Orez Generator de ceas (a); diagrama de timp a generatorului de ceas (b); generarea de impulsuri de ceas asincrone (a) În unele circuite, intervalele de timp sunt importante, nu timpii discreti De exemplu, un eveniment poate să apară nu în fața IIV'Isa, ci în orice moment când nivelul impulsului C este ridicat Un alt eveniment poate avea loc numai atunci când nivelul impulsului lui S este ridicat I і /іi, sunt necesare mai mult de două intervale, trebuie furnizate mai multe linii de ceas sau stările de impuls înalt-jos ale celor două ceasuri trebuie să se suprapună parțial în timp În acest din urmă caz, se pot distinge intervale separate: Generatoarele de ceas pot fi sincrone În acest caz, timpul de existență și novație a unui impuls cu un nivel ridicat este egal cu timpul de existență a unui impuls cu un nivel scăzut (vezi Fig , b) Pentru a obține o serie asincronă de impulsuri-i pn (a se vedea semnalul C în Fig , c), trebuie să deplasați semnalul oscilatorului principal, ІН folosind circuitul de întârziere Apoi semnalul primit este conectat la originalul i igіalom folosind funcția logică AND Memorie Memoria este o componentă necesară a oricărui computer Fără memorie, nu ar exista computere, cel puțin nu cele pe care le avem acum Memoria este folosită pentru a stoca atât comenzi, cât și date În următoarele subsecțiuni, noi ne uităm la principalele componente ale dentului, începând de la nivelul supapelor Vom vedea cum funcționează, cum pot fi construite cu o capacitate mare Încuietori Pentru a crea un bit de memorie, aveți nevoie de un circuit care să „suprascrie” cumva valorile anterioare de intrare Un astfel de circuit poate fi construit cu două porți NOR, așa cum se arată în Fig a Circuite similare pot fi construite din porți NAND Nu vom menționa aceste circuite în continuare, deoarece sunt în esență identice cu circuitele cu porți NOR Orez zăvor NOR în starea (a); zăvor NOR în starea (b); tabel de adevăr pentru funcția NOR (c) Schema prezentată în fig , a, se numește zăvor SR Are două intrări: (Setare - instalare) și R (Resetare - resetare) Are, de asemenea, două ieșiri complementare, Q și Q Spre deosebire de circuitul combinatoriu, ieșirile latch nu sunt determinate de intrările de curent Pentru a înțelege cum funcționează zăvorul, să presupunem că = și R = (în general, semnalul la aceste intrări este de cele mai multe ori) Să presupunem, de asemenea, că Q = Deoarece Q este returnat la poarta NOR de sus și ambele intrări la această poartă sunt , atunci ieșirea sa, Q, este Una este returnată la poarta de jos, care se termină cu o intrare , celălalt este , iar rezultatul este Q = O astfel de stare este cel puțin consecventă din punct de vedere logic (vezi Fig , a) Acum să ne imaginăm că Q = și R și sunt încă Poarta de sus are intrări și și o ieșire Q (adică ) care merge înapoi la poarta de jos O astfel de stare, prezentată în fig , b, este de asemenea consecvent din punct de vedere logic Situația în care ambele ieșiri sunt nu este consecventă din punct de vedere logic, deoarece în acest caz ambele porți ar avea două zerouri la intrare, ceea ce ar duce la unul la ieșire, nu la zero În mod similar, este imposibil să avem ambele ieșiri egale cu , deoarece asta ar avea ca rezultat intrări de și , ceea ce face ca ieșirea să fie și nu Derivarea noastră este simplă: la R = = , zăvorul are două stări stabile, pe care le vom numi și în funcție de Q, Acum să luăm în considerare efectul semnalelor de intrare asupra stării latch-ului Să presupunem că ia valoarea în timp ce Q = Atunci intrările superioare ale porții sunt și , ceea ce duce la semnalul de ieșire Y este Această modificare face ca ambele intrări către poarta de jos să fie egale cu și, în consecință, ieșirea este Astfel, setarea la nu transformă starea de la la Setarea R la când zăvorul este -'ініі și în starea , nu provoacă nicio modificare, deoarece ieșirea porții inferioare III OR este atât pentru intrările cât și pentru intrările AND Folosind un raționament similar, este ușor de observat că setarea S la I atunci când starea de blocare este (adică când Q = ) nu provoacă nicio modificare, iar setarea R la determină schimbarea stării de blocare Astfel, dacă este , atunci Q este , indiferent de starea anterioară a zăvorului În mod similar, schimbarea lui R la determină Q - Circuitul „își amintește” dacă ultimul semnal a fost S sau R Folosind proprietatea ♦ io, putem construi memoria computerului Încuietori SR sincron Poate fi mai convenabil ca starea zăvorului să se schimbe doar în momentele definitive/inițiale Pentru a atinge acest obiectiv, vom schimba ușor circuitul principal pentru a obține un latch SR sincron (Figura ) generator de ceas Orez Încuietoare SR sincronă Circuitul are o intrare suplimentară de ceas, care este în mare parte Dacă această intrare este , atunci ambele ieșiri ale porților AND sunt și, indiferent de valorile și R, zăvorul nu își schimbă starea Când valoarea intrării ceasului este , porțile AND sunt dezactivate și starea de blocare devine dependentă de și R Termenii turn-on și gating sunt adesea folosiți pentru a desemna faptul că intrarea ceasului este Până acum, nu ne-am dat seama ce se întâmplă când = R = Și din motive evidente: când atât R, cât și revin în cele din urmă la , circuitul devine idiosincratic Singura stare acceptabilă pentru S = R = \ este (JQ - , dar de îndată ce ambele intrări revin la , zăvorul trebuie să treacă la una dintre cele două stări stabile Dacă una dintre intrări este setată la , aceasta este diferit de celălalt, care rămâne la „câștigă”, deoarece este singura intrare care controlează starea latch-ului Dacă ambele intrări merg la în același timp (ceea ce este foarte puțin probabil), latch-ul alege aleatoriu una dintre ele stări stabile Încuietori D sincron Pentru a rezolva situația cu incertitudinea SR-latch (incertitudinea se stinge dacă S = R = ), este necesar să se prevină apariția acesteia eu ia fig prezintă un circuit de blocare cu o singură intrare I) Deoarece intrarea către poarta AND inferioară este întotdeauna codul invers al intrării către poarta AND superioară, situația în care ambele intrări sunt nu apare niciodată Când D = și intrarea ceasului este , blocarea trece în starea Q = Când D = și intrarea ceasului este , blocarea trece în starea Q = Cu alte cuvinte, când intrarea ceasului este , valoarea curentă a lui D este eșantionată și stocată într-un dispozitiv de blocare Acest circuit, numit D-latch sincron, este o memorie pe un bit Valoarea stocată este întotdeauna disponibilă la ieșirea Q Pentru a încărca valoarea curentă (t) în memorie, trebuie aplicat un impuls pozitiv liniei de semnal de ceas Orez Încuietoare D sincronă Un astfel de circuit necesită tranzistori AND Circuitele mai complexe (cele care sunt utilizate în mod obișnuit în practică) pot stoca un bit pe doar tranzistoare Circuitul rămâne într-o stare staționară atâta timp cât i se aplică putere (nu este indicat în figură) Mai târziu ne vom uita la circuitele care uită rapid starea în care se află - au nevoie de „mementouri” constante pentru a preveni acest lucru declanșatoare Multe circuite, dacă este necesar, selectează o valoare pe o anumită linie la un moment dat în timp și o amintesc Într-un astfel de circuit, numit flip-flop, tranziția de stare nu are loc atunci când semnalul de ceas este , ci atunci când semnalul de ceas trece de la la (în creștere) sau de la la (în scădere) Prin urmare, lungimea pulsului de ceas nu contează, deoarece tranzițiile sunt rapide Să subliniem încă o dată diferența dintre un flip-flop și un zăvor Declanșatorul este declanșat de margine, iar zăvorul este declanșat de nivel Rețineți că acești termeni sunt adesea confuzi în literatură Mulți autori folosesc termenul „flip-flop” atunci când se referă la un zăvor și invers Există mai multe abordări pentru proiectarea declanșatorilor De exemplu, dacă există o modalitate de a genera un impuls foarte scurt pe marginea semnalului de ceas, acest impuls ar putea fi aplicat la D-latch În literatura internă, termenul „latch” (latch) nu este folosit deloc, se vorbește despre declanșatoare Cu toate acestea, aceasta introduce conceptul de declanșare T, care este declanșatorul „adevărat” - Notă științific ed În realitate, o astfel de metodă există Circuitul corespunzător este prezentat în Fig , a Timp ►- b Rio Generator de impulsuri (a); diagramă de timp pentru patru puncte din diagrama (b) La prima vedere, poate părea că ieșirea porții AND va fi întotdeauna n-'ieiiii, deoarece funcția AND din orice semnal cu inversarea lui dă , dar în realitate situația este ceva mai complicată Când semnalul trece prin banda AI, există o întârziere mică, dar nu zero Această schemă funcționează tocmai din cauza acestei întârzieri Să presupunem că măsurăm tensiunea în patru puncte a, b, c și d Semnalul de intrare în punctul a este impulsul ceasului principal (graficul inferior din Figura b) Semnalul din punctul b este afișat deasupra acestuia Rețineți că acest semnal este inversat și este furnizat cu o oarecare întârziere Timpul de întârziere depinde de tipul de invertor și este de obicei de câteva nanosecunde Semnalul din punctul c este de asemenea întârziat, dar această întârziere se datorează numai timpului de tranzit al semnalului (la viteza luminii) Dacă distanța fizică dintre punctele a și c este, de exemplu, de de microni, atunci întârzierea de propagare a semnalului este de , ns, ceea ce, desigur, este neglijabil în comparație cu timpul necesar semnalului pentru a călători prin invertor Astfel, SC > SC a b c d Orez Încuietori D și șlapi D Registrele Există diverse configurații de declanșare Pe fig Figura arată cum sunt combinate opt bistabile pentru a forma un registru de biți Registrul primește o valoare de intrare de biți (/() -І ) când semnalul de ceas CK se schimbă Toate liniile de ceas sunt conectate la un semnal de intrare al SC, astfel încât atunci când starea SC se schimbă, registrul primește o nouă valoare de date de biți de la magistrala de intrare Declanșatoarele în sine sunt de același tip ca în Fig , r, dar intrările inversoare sunt anulate de invertorul conectat • (Ah, deci flip-flops-urile sunt declanșate la o tranziție de la la Toate cele opt semnale ale njnggka sunt de asemenea combinate, dar când semnalul de resetare CLR ajunge la • nmpiiie , toți declanșatorii trec în starea Dacă nu înțelegeți de ce • Semnalul SC în sus și în jos este inversat la intrare și apoi inversat • Dacă la fiecare flip-flop, răspunsul este simplu: semnalul de intrare nu are suficientă putere pentru a declanșa toate cele opt flip-flop; invertorul de intrare în sine este folosit ca amplificator O Iq Oi C O l O O CK CLR O l O l O l O l Orez Registrul de biți construit din flip-flops cu un singur bit Registrul K-bit poate fi folosit ca element structural pentru a construi registre cu o capacitate mai mare De exemplu, un registru de de biți poate fi construit din două registre de biți prin tricotarea liniilor de ceas CK și a liniilor de resetare CLR Registrele și utilizările lor vor fi discutate mai detaliat în Capitolul Organizarea memoriei Deși am făcut trecerea de la o memorie simplă cu o capacitate de bit (vezi Fig ) la una pe K-biți (vezi Fig , b), construirea unei memorie de capacitate mare necesită un alt mod de organizare, în care puteți accesa cuvinte individuale Un exemplu de organizare a memoriei care satisface acest criteriu este prezentat în Fig Această memorie conține patru cuvinte de biți Fiecare operație citește sau scrie un întreg cuvânt de biți Deși cantitatea totală de memorie ( biți) nu este cu mult mai mare decât cea a unui flip-flop de biți, boombox-ul necesită mai puțini pini și, cel mai important, această organizare este aplicabilă pentru construirea de memorie mare Rețineți că numărul de cuvinte este întotdeauna o putere a lui Deși organizarea memoriei prezentată în Fig poate părea complicat la prima vedere, dar este de fapt foarte simplu datorită structurii sale regulate Microcircuitul conține linii de intrare, în special intrări pentru date - / (), C și / ; intrari pentru adrese - L () si At; intrări pentru control - CS (Chip Select - selectarea unui element de memorie), RD (RcaD - citire, acest semnal nu face distincție între citire și scriere) și OE (Output EpaYe - permisiunea de a emite semnale de ieșire), precum și linii de ieșire pentru date - O () și O , Date de intrare h* Scrie poarta Exemplu de cuvânt linia Ai Ao Exemplu de cuvânt rândul Exemplu de cuvânt rândul CS RD OE CS•RD- Cuvântul Cuvântul Cuvântul Cuvântul O, O Rezoluție de ieșire = CS - RD • OE Orez Diagrama bloc logica pentru memorie x Fiecare rând reprezintă unul dintre cuvintele de biți Când citiți și scrieți, un cuvânt întreg este întotdeauna citit sau scris Interesant este că această memorie de biți necesită mai puțini pini decât registrul de biți din exemplul anterior Un flip-flop de biți necesită de pini (inclusiv putere și masă), în timp ce memoria de biți necesită doar deoarece, spre deosebire de un registru, cei biți de memorie partajează un semnal de ieșire Starea de intrare a adresei determină căror patru biți de memorie au voie să introducă sau să iasă o valoare Pentru a selecta acest bloc de memorie, logica externă trebuie să seteze semnalul CS la și, de asemenea, să seteze semnalul RD la pentru citire și pentru scriere Cele două linii de adresă trebuie să indice care dintre cele patru cuvinte de biți urmează să fie citit sau scris La citire, liniile de intrare pentru date nu sunt utilizate ііп'іі' іuіotsya, iar cuvântul selectat va fi trimis la liniile de ieșire a datelor Cu o nișă, biții găsiți pe liniile de intrare de date sunt încărcați în cuvântul de memorie de intrare; liniile de ieșire nu sunt utilizate Acum să vedem cum memoria prezentată în Fig 'Igiyre gate Și pentru alegerea cuvintelor din partea stângă a circuitului formează un decodor Alte invertoare sunt amplasate astfel încât fiecare poartă să fie pornită de o anumită adresă Fiecare poartă conduce o linie de selecție a cuvântului (pentru i ion , , și ) Când cipul este pe cale să scrie, șuieratul vertical CS-RD este setat la , activând una dintre cele patru porți de scriere cuvinte, încarcând intrarea în declanșatoarele pentru acel cuvânt O scriere se face numai dacă semnalul CS este și RD este , în timp ce se scrie doar cuvântul selectat de adresele A () și A (; cuvintele rămase nu se modifică Procesul de citire este similar cu coprocesul de scriere Decodificarea adreselor are loc exact în același mod ca atunci când scrieți Dar, în acest caz, linia CS-RD este setată la , astfel încât toate porțile de scriere sunt dezactivate și niciunul dintre riggeri nu este schimbat În schimb, linia de selectare a cuvântului declanșează porțile AND asociate cu biții Q ai cuvântului selectat Astfel, cuvântul selectat își alimentează datele la porțile SAU cu intrări situate în partea de jos a circuitului i, iar cele trei cuvinte rămase ies Prin urmare, ieșirea porților SAU este identică cu valoarea stocată în acest cuvânt Celelalte trei cuvinte nu au niciun efect asupra rezultatului Am putea proiecta un circuit în care trei porți SAU să fie conectate prin trei linii de ieșire, dar acest lucru ar cauza unele probleme Am tratat liniile de intrare a datelor și liniile de ieșire a datelor ca linii diferite În practică, se folosesc aceleași linii Dacă am conecta porțile SAU la liniile de ieșire a datelor, cipul ar încerca să scoată date (adică să seteze fiecare linie la o anumită valoare) chiar și în timpul procesului de scriere, interferând cu intrarea normală a datelor Din acest motiv, este de dorit să conectați cumva porțile SAU la liniile de ieșire a datelor atunci când citiți și să le deconectați complet când scrieți Tot ce avem nevoie este un comutator electronic care se poate conecta și deconecta într-o fracțiune de nanosecundă Din fericire, astfel de comutatoare există Pe fig , a prezintă o imagine simbolică a așa-numitului element tampon fără inversare Are o linie de intrare a datelor, o linie de ieșire a datelor și o linie de intrare de control Când intrarea de control este , elementul tampon acţionează ca un conductor (Fig b) Când intrarea de control este , elementul tampon acționează ca un izolator (Figura c), ca și cum cineva ar tăia ieșirea de date din restul circuitului cu tăietori de sârmă Conexiunea poate fi restabilită în câteva nanosecunde setând semnalul de control la Pe fig Figura d prezintă un element tampon inversat care acționează ca un invertor normal când semnalul de control este și separă ieșirea de restul circuitului când semnalul de control este Ambele elemente tampon sunt dispozitive cu trei stări, deoarece pot ieși zero un semnal, un singur semnal sau niciun semnal (caz cu circuit deschis) Elementele tampon îmbunătățesc, de asemenea Intrare Sfârșit de săptămână date date Control A b în Orez Element tampon fără inversare (a); reprezentarea elementului tampon fără inversare când semnalul de control este (b); reprezentarea elementului tampon fără inversare când semnalul de control este (a); element tampon cu inversare (r) semnale, astfel încât să poată gestiona mai multe semnale în același timp Uneori sunt folosite în circuite tocmai ca amplificatoare, în timp ce capacitatea lor de comutare nu este folosită Până acum, ar trebui să vă fie clar de ce aveți nevoie de trei elemente tampon fără inversare pe liniile de ieșire a datelor Când semnalele , RD și OE sunt , semnalul de activare a ieșirii este, de asemenea, , ca urmare, elementele tampon sunt declanșate și un cuvânt este plasat pe liniile de ieșire Când unul dintre semnalele CS, RD și OE este , ieșirile sunt deconectate de la restul circuitului Cip-uri de memorie Avantajul memoriei prezentate în Fig este că o astfel de structură este aplicabilă în dezvoltarea memoriei mari Figura prezintă un circuit x (pentru cuvinte a câte biți fiecare) Pentru a-l extinde la x , trebuie să adăugați încă coloane de declanșare cu câte declanșatori fiecare, precum și linii de intrare și de ieșire Pentru a trece de la o schemă x la o schemă x , trebuie să adăugați încă patru rânduri de declanșatori, câte trei declanșatori fiecare, precum și o linie de adresă L , Cu această structură, numărul de cuvinte din memorie trebuie să fie o putere de doi pentru o eficiență maximă, iar numărul de biți dintr-un cuvânt poate fi orice Tehnologia de fabricație a circuitelor integrate se potrivește perfect cu structura obișnuită a cipurilor de memorie Pe măsură ce tehnologia avansează, numărul de biți care se pot potrivi pe un singur cip crește constant, dublându-se de obicei la fiecare luni (legea lui Moore) Odată cu apariția cipurilor mari, cipurile mici sunt întotdeauna învechite, deoarece există întotdeauna un compromis între capacitate, viteză, putere, preț și ușurința de interfață De obicei, cele mai mari cipuri moderne sunt la mare căutare și, prin urmare, costă mai mult pe bit decât cipurile mici Cu orice cantitate de memorie, există mai multe opțiuni pentru organizarea microcircuitului Pe fig Figura prezintă două structuri posibile pentru un cip de Mbiți: K x și K x (dimensiunile cipului de memorie sunt de obicei date în biți, nu în octeți, așa că vom respecta această convenție aici) Pe fig , puteți vedea linii de adresă pentru accesarea unuia dintre cei de octeți și linii de date pentru încărcarea sau stocarea octetului selectat a b Orez Două moduri de organizare a memoriei de Mb („O mică notă despre terminologie Pe unii pini, o tensiune scăzută provoacă o anumită acțiune, pe altele rămâne o tensiune scăzută Pentru a evita confuzia, vom folosi termenul set-and-signal atunci când o anumită acțiune este numită, în loc de a spune: „tensiunea crește sau scade Astfel, pentru unii pini Vi, valoarea semnalului înseamnă setarea unuia, pentru alții înseamnă setarea zero unitate, semnalul CS este Termenul opus este resetat Să revenim acum la microcircuitul nostru Deoarece un computer conține de obicei multe cipuri de memorie, este necesar un semnal pentru a selecta cip-ul necesar, astfel încât cipul de care avem nevoie să răspundă la apel și restul nu Semnalul CS (Chip Select) este utilizat în acest scop Op este setat să pornească cipul Pe lângă ok>, aveți nevoie de o modalitate de a face distincția între citiri și scrieri Semnalul WE (Write Written - write permission) indică faptul că datele trebuie scrise și nu citite În cele din urmă, semnalul OE (Output EnaYe - rezoluție de ieșire) este setat să emită semnale de ieșire Când acest semnal nu este prezent, ieșirea este deconectată de la restul circuitului eu ia fig , b folosește o schemă de adresare diferită Cipul este o matrice de x celule de un bit, care este de Mbit Pentru a accesa un cip, trebuie mai întâi să selectați un rând Pentru іtogo pomer pe biți, această linie este alimentată la pinii de adresă Apoi este setat semnalul RAS (Row Address Strobe) După aceea, numărul coloanei este aplicat pinilor de adresă și este setat semnalul C AS (Column Address Strobe) Microcircuitul răspunde la g și a condus prin primirea sau furnizarea unui bit de date Cipurile de memorie mari sunt adesea fabricate ca matrice m x n care sunt accesate rând și coloană Această organizare a memoriei reduce numărul de pini necesari, dar, pe de altă parte, încetinește accesul la microcircuit, deoarece sunt necesare două cicluri de adresare: unul pentru rând, celălalt pentru coloană Pierderea de viteză este parțial compensată de faptul că în unele microcircuite este posibilă transmiterea unei adrese de rând și apoi transmiterea mai multor adrese de coloană pentru a accesa biții seriali ai rândului Cu mulți ani în urmă, cele mai mari cipuri de memorie erau de obicei aranjate așa cum se arată în Fig b Deoarece dimensiunea cuvântului a crescut de la la de biți și mai mult, a devenit incomod să folosiți astfel de microcircuite Pentru a construi memorie cu cuvinte de de biți din microcircuite de K x , sunt necesare de microcircuite, care funcționează în paralel Aceste de cipuri au o capacitate totală de cel puțin MB Dacă utilizați K x cipuri, veți avea nevoie de doar cipuri, dar memoria va fi de MB Pentru a nu se încurca cu de cipuri, majoritatea producătorilor produc familii de cipuri cu lungimi de cuvinte de , și biți Situația cu cuvintele pe de biți este, desigur, și mai rea Exemple de cipuri moderne cu o capacitate de Mbit sunt prezentate în fig Fiecare astfel de cip conține patru bănci de memorie internă de Mbit fiecare; în consecință, sunt necesare două linii de selecție a băncii pentru a defini o bancă Pe un microcircuit de M x , prezentat în fig , a, sunt alocate linii pentru semnalele RAS, pentru semnalele CAS și linii pentru selecția băncii Luate în ansamblu, de semnale oferă capacitatea de a adresa de celule interne de biți Pe un microcircuit de M x , prezentat în fig , , linii sunt alocate pentru semnalele RAS, linii pentru CAS și linii pentru selecția băncii SA A A AZ A A A A A A A A A Cip de memorie Mx ( Mbit) D RAS CAS Banca Banca *-D CS WE OE b A Orez Două moduri de a organiza un cip de memorie de Mbit J 'pini Astfel, de semnale fac posibilă adresarea oricăreia dintre celulele interne de biți Numărul de rânduri și coloane din jetoane este ajustat pe baza factorilor de inginerie Matricea nu trebuie să fie „Sud” pentru a fi pătrată Aceste exemple demonstrează în mod clar importanța a două aspecte neînrudite ale designului cipului de memorie Primul se referă la lățimea ieșirii (în biți) - cu alte cuvinte, numărul de biți ( , , , etc ) din semnalul de ieșire Al doilea aspect este modul în care sunt reprezentați biții de adresă; Există două opțiuni aici: în primul rând, biții de adresă pot fi prezentați simultan pe diferiți pini și, în al doilea rând, poate exista o reprezentare secvențială a rândurilor și coloanelor - așa cum se arată în Fig Înainte de a trece la proiectarea microcircuitului, specialistul trebuie să decidă asupra ambelor aspecte RAM și ROM Ih g tipuri de memorie, pe care le-am considerat până acum, au un lucru în comun - vіiiiietvo: vă permit să scrieți și să citiți informații O astfel de memorie se numește RAM (memorie cu acces aleatoriu) sau RAM (memorie aleatorie ai ci - memorie cu acces aleatoriu) Există două tipuri de RAM: statică și dinamică RAM statică (SRAM) este construită folosind D-flip-flops Informațiile din RAM sunt stocate atâta timp cât sunt alimentate: secunde, minute, ore și chiar dynes RAM statică este foarte rapidă De obicei, timpul de acces este de câteva nanosecunde Din acest motiv, RAM statică este adesea folosită ca cache de nivel al doilea În RAM dinamică (Dynamic RAM, DRAM), dimpotrivă, declanșatoarele nu sunt utilizate DRAM este o serie de celule, fiecare conținând un tranzistor și un mic condensator Condensatorii pot fi contaminați și epuizați, permițând depozitarea gloanțelor și unităților Deoarece sarcina electrică tinde să dispară, fiecare bit din DRAM trebuie actualizat (reîncărcat) la fiecare câteva milisecunde pentru a preveni scurgerea datelor Deoarece logica externă trebuie să se ocupe de actualizare, DRAM necesită o interfață mai complexă decât DRAM-ul japoneză, deși acest dezavantaj este compensat de volumul mare Deoarece DRAM are nevoie doar de un tranzistor și un condensator pe bit (RAM statică are nevoie de tranzistori pe bit în cel mai bun caz), DRAM are o densitate de scriere foarte mare (mulți biți pe cip) Din acest motiv, memoria principală se bazează aproape întotdeauna pe RAM dinamică, dar RAM dinamică este foarte lentă (timpul de acces durează zeci de nanosecunde) Astfel, combinația dintre cache-ul bazat pe SRAM și memoria principală bazată pe DRAM combină avantajele ambelor dispozitive Există mai multe tipuri de RAM dinamică Cel mai vechi tip încă utilizat este FPM (Fast Page Mode) Această memorie RAM este o matrice de biți Hardware-ul reprezintă adresa rândului și apoi adresele coloanelor (am descris acest lucru proces, când vorbim despre dispozitivul de memorie prezentat în fig b) Datorită fenomenului semnalelor transmise, memoria funcționează asincron în raport cu generatorul principal de ceas al sistemului FPM este înlocuit treptat de memoria EDO (Extended Data Output) , care permite accesarea memoriei înainte ca accesul anterior să se încheie Acest mod pipeline, deși nu accelerează accesul la memorie, îmbunătățește debitul permițând mai multe cuvinte pe secundă Memoriile precum FPM și EDO au rămas relevante în acele zile când timpul de ciclu al cipurilor de memorie nu depășea ns Ulterior, odată cu creșterea vitezei procesoarelor, s-a format nevoia de cipuri de memorie mai rapide, iar apoi modurile asincrone FPM și EDO au fost înlocuite cu RAM dinamică sincronă (Synchronous DRAM, SDRAM) RAM dinamică sincronă este controlată de la ceasul sistemului principal Acest dispozitiv este un hibrid de memorie RAM statică și dinamică Principalul avantaj al RAM dinamică sincronă este că elimină dependența cipului de memorie de semnalele de control CPU-ul spune memoriei câte cicluri să ruleze și apoi îl rulează Fiecare ciclu emite , sau biți, în funcție de numărul de linii de ieșire Eliminarea dependenței de semnalele de control duce la un transfer mai rapid de date între CPU și memorie Următorul pas în evoluția SDRAM a fost memoria DDR (Double Data Rate) Această tehnologie oferă date de ieșire atât în față, cât și la scăderea pulsului, drept urmare rata de transfer este dublată De exemplu, un cip de biți de acest tip, care rulează la MHz, emite două valori de biți de de milioane de ori pe secundă (desigur, această viteză este menținută pentru o perioadă scurtă de timp); astfel, teoretic, viteza pe termen scurt poate ajunge la , GB/s Interfețele de memorie DDR și DDR oferă o creștere suplimentară a performanței față de DDR prin creșterea vitezei magistralei de memorie la MHz, respectiv MHz La momentul publicării cărții, cele mai rapide cipuri DDR puteau scoate date la o viteză de GB/s Memorie non volatila RAM nu este singurul tip de cipuri de memorie În multe cazuri, datele trebuie păstrate chiar și atunci când alimentarea este oprită (de exemplu, când vine vorba de jucării, diverse dispozitive și mașini) Mai mult, după instalare, nici programul, nici datele nu trebuie modificate Aceste cerințe au condus la apariția ROM (memorie doar în citire) sau ROM (Memorie numai în citire - memorie doar în citire) ROM-urile nu permit modificarea și ștergerea informațiilor stocate în ele (nici intenționat, nici accidental) Datele sunt scrise pe ROM în timpul producției Pentru a face acest lucru, se face un șablon cu un anumit set de biți, care este suprapus pe un fotosensibil Memoria dinamică de tip EDO a înlocuit practic memoria dinamică convențională care funcționează în modul FPM la mijlocul anilor nouăzeci - Notă științific ed mmigial, iar apoi părțile deschise (sau închise) ale suprafeței sunt gravate Cel mai simplu mod de a schimba programul în ROM este schimbarea întregului cip ROM-urile sunt mult mai ieftine decât RAM dacă sunt comandate în vrac pentru a plăti costul realizării unui șablon Cu toate acestea, nu permit imgpenia după lansare și poate dura câteva săptămâni între comandarea unui ROM și lansarea Pentru a facilita companiilor să dezvolte noi dispozitive bazate pe ROM, au fost lansate ROM-uri programabile (PROM) Spre deosebire de ROM-urile convenționale, nm poate fi programat pe teren pentru a reduce timpii de livrare Multe ROM-uri programabile conțin o serie de legături fuzibile mici Pentru a arde un anumit jumper, trebuie să selectați rândul și coloana necesare, apoi aplicați o tensiune înaltă unui anumit pin al microcircuitului („Următoarea dezvoltare a acestei linii este un ROM programabil șters (l insable PROM, EPROM), care nu poate fi programat numai în operare de la distanță, ci și șterge informațiile din acesta Dacă fereastra de cuarț și acest ROM sunt expuse la lumina ultravioletă în decurs de minute, toți biții vor fi setați la Dacă sunt multe modificări de făcut, dar timpul unui singur pas de proiectare, ROM-urile care se pot șterge sunt mult mai economice decât ROM-urile obișnuite, deoarece pot fi utilizate în mod repetat , microcircuitul C are o structură care este prezentată în Fig , a, iar o astfel de structură este tipică pentru RAM statică Este interesant că astfel de microcircuite „vechi” nu se sting Ele devin mai ieftine și sunt utilizate în produse de buget , Deocamdată, microcircuitele unice C pot fi cumpărate cu mai puțin de USD, iar cu o cantitate mare de medicamente vor costa mult mai puțin Următoarea etapă este un ROM reprogramabil electronic (Electronic I PROM, EEPROM), care nu trebuie să fie plasat într-o cameră specială pentru ca acesta să fie expus la razele ultraviolete - pentru a șterge informația, este suficient să trimiteți impulsurile corespunzătoare De asemenea, pentru a reprograma acest dispozitiv, nu este nevoie să fie conectat la un dispozitiv de programare special, spre deosebire de un ROM programabil șters În același timp, cele mai mari EPROM-uri și (de ori mai mici decât ROM-urile șterse convenționale și funcționează de două ori mai lent NEPROM-urile nu pot concura cu RAM-urile dinamice-i și statice, deoarece funcționează de ori mai lent, capacitatea lor și r;іz) mai puțin și costă mult mai mult Sunt utilizate numai în acele sisteme când este necesar să se salveze informații atunci când alimentarea este oprită Un tip mai modern de ROM reprogramabil electronic este memoria flash Spre deosebire de Erasable ROM, care este ștearsă prin expunerea la razele ultraviolete, și EEPROM, care este octet cu octet, memoria flash este ștearsă și scrisă în blocuri Mulți furnizori produc plăci de circuite mici care conțin până la GB de memorie Sunt folosite pentru a stoca imagini în camere digitale și în alte scopuri După cum sa discutat în capitolul , flash-ul începe încet să înlocuiască discurile, ceea ce reprezintă un pas uriaș înainte, având în vedere timpul acces in ns Memoria flash oferă timpi de acces mai buni cu un consum mai mic de energie; pe de altă parte, costul unui bit de memorie flash este semnificativ mai mare decât cel al discurilor O scurtă descriere a diferitelor tipuri de memorie este dată în tabel Tabelul Caracteristicile diferitelor tipuri de memorie Tip dispozitiv de stocare Categorie Șterge informații Schimbați informații în funcție de octeți Necesar de alimentare Aplicație SRAM Citire/Scriere Electrică Da Da L Cache DRAM Citire/Scriere Electrică Da Da Memorie principală (vechită) SDRAM Citire/Scriere Electrică Da Da Memorie principală (modele noi) ROM Numai citire Imposibil Nu Nu Dispozitive masive PROM Numai citire Nu este posibil Nu Nu Dispozitive de volum mic EPROM Lumină UV predominant lizibilă Nu Nu Prototiparea dispozitivului EEPROM Citite predominant Electrice Da Nu Prototiparea dispozitivului Memorie flash Citire și scriere Electrică Nu Nu Camere digitale FPGA După cum sa menționat în Capitolul , Field Programmable Gate Arrays (FPGA) sunt cipuri logice programabile - prin încărcarea datelor de configurare corespunzătoare în FPGA, puteți crea un circuit logic arbitrar Principalul avantaj al FPGA este capacitatea de a construi noi circuite hardware în câteva ore (în loc de luni petrecute pe producția de cipuri) Cu toate acestea, circuitele integrate nu vor deveni un lucru din trecut - costul lor în loturi mari este semnificativ mai mic decât cel al FPGA-urilor, funcționează mai rapid și consumă mai puțină energie Cu toate acestea, FPGA-urile, datorită avantajelor lor în faza de proiectare, sunt adesea folosite în prototiparea dispozitivelor și în producția de serie mică Să aruncăm o privire mai atentă la FPGA-uri și să vedem cum sunt utilizate pentru a implementa o gamă largă de circuite logice Cipul FPGA este format din două componente principale care se repetă de multe ori în arhitectura sa: tabele de căutare LUT (LookUp Table) și legături programabile ILGG (Fig a) este un bloc mic de Ііnmіpi programabile, care produce un semnal transmis către registru (opțional) și • ііem și comunicare programabilă Se folosește memoria programabilă pentru • imdіpіiya funcție logică arbitrară LUT din figură are memorie - , care este capabilă să emuleze orice circuit logic cu patru "iod" și patru biți de ieșire Pentru a programa LUT-ul în memorie, sunt folosite răspunsurile logicii combinatorii emulate Cu alte cuvinte, dacă logica combinatorie pentru intrarea X produce valoarea Y, atunci aceasta din urmă este scrisă și , GY cu indicele X Un exemplu din fig b arată cum implementează un singur LUT pe biți ;| contor de biți cu resetare Contorul de la valoarea dată adaugă la valoarea sa curentă (adăugare modulo ) până când ajunge • w pal reset CLR; în acest caz, contorul este resetat la În implementarea contorului din acest exemplu, primele patru elemente ale LUT au fost umplute cu gloanțe Ele oferă o ieșire atunci când contorul este resetat Astfel, primul bit LUT (Y) reprezintă semnalul de intrare resetat (CLR) Pentru restul LUT-urilor, valoarea cu indice / conține rezultatul operației (/ + ) modulo Pentru a finaliza acest circuit, semnalul de ieșire O trebuie conectat printr-o legătură programabilă la semnalul intern de intrare /() Conformitatea semnalului Contor FPGA •z CLR ® ^ SC SC Date Adr treizeci Date Adr cincizeci Orez tabel de conversie FPGA (a); Configurație LUT pentru a crea un contor de biți cu resetare (b) Pentru a înțelege mai bine resetarea contorului FPGA, să vedem cum funcționează Dacă, de exemplu, starea curentă a contorului este , iar semnalul de resetare (CLR) nu este setat, atunci adresa de intrare LUT va fi egală cu , ceea ce va duce la ieșire și la Dacă semnalul de resetare (CLR) este setat în această stare, apoi intrarea LUT-ul va primi , rezultând că următoarea stare este Una peste alta, pare a fi doar o modalitate inteligentă de a crea un contor cu o resetare De fapt, un circuit cu un circuit de creștere și un semnal i-throw pe bistabile va fi mai compact, mai rapid și va consuma mai puțină energie Principalul avantaj al unui circuit bazat pe FPGA este că poate fi construit într-o oră acasă, în timp ce un circuit personalizat mai eficient ar trebui realizat din siliciu, ceea ce ar dura o lună sau mai mult Pentru a utiliza FPGA, trebuie să scrieți o descriere a circuitului sau a unui program într-un limbaj de descriere hardware (un limbaj de programare folosit pentru a descrie structurile hardware) Descrierea este procesată de un sintetizator care asociază circuitul cu o arhitectură FPGA specifică Una dintre problemele cu utilizarea FPGA-urilor este că nevoile unui anumit circuit depășesc adesea capacitățile unui FPGA FPGA-urile sunt fabricate cu un număr variabil de LUT-uri, cu o creștere a numărului acestora din urmă ducând la o creștere a costului De regulă, dacă rezultatul nu se încadrează în cerințe, fie trebuie să simplificați circuitul, fie să renunțați la o parte din funcționalitate, fie să cumpărați o matrice FPGA mai mare (și mai scumpă) Circuitele foarte mari pot depăși capacitățile chiar și ale celor mai mari FPGA-uri, caz în care proiectantul trebuie să combine mai multe FPGA-uri în circuit; sarcina devine cu siguranță mai complicată, dar rămâne totuși mult mai ușor să proiectați un circuit integrat specializat cu drepturi depline Chip-uri și magistrale de procesor Înarmați cu informații despre microcipuri, generatoare de ceas și cipuri de memorie, putem aduna toate piesele și începem să studiem sisteme întregi În această secțiune, ne uităm mai întâi la procesoarele la nivel logic digital, inclusiv la pinouts (adică la semnificația semnalelor de pe diferiții pini) Deoarece procesoarele sunt strâns legate de magistralele pe care le folosesc, vom sublinia, de asemenea, pe scurt principiile de bază ale proiectării magistralelor Următoarele secțiuni oferă exemple detaliate de procesoare, vârful lor și interacțiunile dintre ele Chip-uri de procesor Toate procesoarele moderne se potrivesc pe un singur cip, ceea ce face ca interacțiunile lor cu restul sistemului să fie bine definite Fiecare cip de procesor conține un set de pini prin care se face schimb de informații cu lumea exterioară Unii pini transmit semnale de la CPU, alții primesc semnale de la alte componente, iar alții fac ambele Examinând funcțiile tuturor pinii, putem afla cum interacționează procesorul cu dispozitivele de memorie și I/O la nivel logic digital Concluziile microcircuitului procesorului central pot fi împărțite în trei tipuri: adresă, informații și control Acești pini sunt conectați la pinii corespunzători de pe cipurile de memorie și cipurile dispozitivului I/O printr-un set de fire paralele (numite magistrală) Pentru a apela o comandă, CPU trimite mai întâi adresa acelei comenzi în memorie pe pinii adresei Apoi activează una sau mai multe linii de control pentru a spune memoriei de ce are nevoie (de exemplu, pentru a citi un cuvânt) Memoria răspunde plasând cuvântul necesar pe pinii de date ai procesorului și semnalând că a fost făcut Când CPU primește acest semnal, citește cuvântul și execută instrucțiunea apelată Comanda poate necesita citirea sau scrierea cuvintelor care conțin date Și în acest caz, întregul proces se repetă pentru fiecare cuvânt suplimentar, dacă are loc procesul de citire și scriere, vom analiza în detaliu în continuare Deocamdată, trebuie să înțelegeți că procesorul comunică cu dispozitivele de memorie și I/O trimițând semnale către pini și primind semnale sau intrări Nu există altă modalitate de a face schimb de informații Numărul de pini de adresă și numărul de pini de informații sunt doi parametri cheie care determină performanța unui procesor Un microcircuit care conține t pini de adresă poate accesa ™ celule de memorie De obicei, i este , sau Un cip cu n pini de informații poate citi sau scrie un cuvânt pe w biți într-o singură operație De obicei, u este , sau Un CPU cu pini de date va avea nevoie de operații pentru a citi un cuvânt de de biți, în timp ce un CPU cu de pini de date poate face aceeași treabă în operațiuni n/nicio Prin urmare, un cip cu de pini de informații este mult mai rapid, dar și mult mai scump Pe lângă ieșirile de adresă și informații, fiecare procesor conține ieșiri de control Acești pini vă permit să reglați și să sincronizați datele către și de la procesor și să efectuați alte funcții Toate procesoarele conțin pini pentru alimentare (de obicei + , V sau + , V), masă și ceas (pătrat) Restul pinii variază de la procesor la procesor Cu toate acestea, concluziile de control pot fi împărțite în mai multe categorii principale: + management autobuz; eu intrerup; + arbitraj autobuz; + semnale coprocesor; + stare; + diverse În cele ce urmează, vom descrie pe scurt fiecare dintre aceste categorii, iar când ne uităm la cipurile Intel Core i , TI OMAP și Atmel ATmegal , vom oferi informații mai detaliate O schemă a unui CPU tipic care utilizează aceste tipuri de semnale este prezentată în Fig Pinii de control al magistralei sunt în cea mai mare parte ieșiri de la CPU către magistrală (și, prin urmare, intrări către cipurile de memorie și cipurile I/O) Acestea vă permit să indicați că procesorul dorește să citească informații din memorie sau să scrie informații în memorie sau să facă altceva Pinii de întrerupere sunt intrări de la dispozitivele I/O către procesor În majoritatea sistemelor, procesorul poate semnala unui dispozitiv I/O să înceapă o operație și apoi să facă altceva în timp ce dispozitivul I/O își face treaba Când dispozitivul I/O se termină, controlerul I/O trimite un semnal către unul dintre pinii de întrerupere pentru a întrerupe procesorul și a-l forța să întrețină dispozitivul I/O (de exemplu, verificați erorile I/O) Unele procesoare includ un pin pentru a confirma semnalul de întrerupere ilana a LOGICA digitala Adresarea Arbitraj autobuz Date Gestionarea autobuzelor Microprocesor tipic coprocesor Stat întreruperi Alte semnale Simbolul Pământului Cifra Putere sincronizator semnal Orez Pinout-ul unui procesor tipic Săgețile indică semnale de intrare și de ieșire, iar liniile diagonale scurte indică prezența mai multor ieșiri de acest tip Numărul acestor pini depinde de modelul procesorului Pinii de arbitraj de magistrală sunt necesari pentru a regla fluxul de informații pe magistrală, adică pentru a evita astfel de situații când două dispozitive încearcă să folosească magistrala în același timp În ceea ce privește arbitrajul, procesorul este considerat a fi doar unul dintre dispozitive Unele procesoare pot funcționa cu diferite co-procesoare (de exemplu, GPU-uri, procesoare în virgulă mobilă etc ) Pentru a asigura schimbul de informații între procesor și coprocesor, se folosesc pini speciali Pe lângă acești pini, unele procesoare au pini suplimentari Unele dintre ele emit sau primesc informații de stare, altele sunt necesare pentru a reporni computerul, iar altele sunt concepute pentru a asigura compatibilitatea cu cipurile dispozitivelor I/O mai vechi Anvelope pentru computer O magistrală este o serie de fire care conectează mai multe dispozitive Anvelopele pot fi clasificate în funcție de funcția lor Acestea pot fi interne procesorului și servesc la transferul de date către și de la ALU, sau pot fi externe procesorului și pot conecta procesorul la memorie sau la dispozitive I/O Fiecare tip de anvelopă are anumite proprietăți și fiecăruia dintre ele li se impun anumite cerințe În aceasta și în următoarele subsecțiuni, ne vom concentra asupra magistralelor care conectează CPU la memorie și dispozitivele I/O În capitolul următor, vom arunca o privire mai atentă asupra magistralelor interne ale procesorului Primele computere personale aveau o singură magistrală externă, numită magistrală de sistem Acesta a constat din mai multe fire de cupru (de la la ) care au fost încorporate în placa de bază Pe placa de bază, la distanțe egale unul de celălalt, existau conectori pentru cipuri de memorie și dispozitive de intrare-ieșire Calculatoarele personale moderne conțin de obicei o magistrală specială între unitatea centrală de procesare și memorie și extreme Merc este o altă magistrală pentru dispozitivele I/O Pe fig sistem imagine-mnim cu o magistrală de memorie și o magistrală I/O Cip de procesor Autobuz pe cip Orez Sistem informatic cu mai multe autobuze Anvelopele sunt de obicei descrise în literatură ca săgeți îndrăznețe, așa cum se arată până acum în această figură Există o mică diferență între o săgeată îngroșată și o săgeată fără aldine, cu o linie diagonală scurtă care indică numărul de biți Când tipul tuturor biților este același, de exemplu toți biții de adresă sau toți biții de date, este desenată o săgeată obișnuită Când liniile de adresă, repararea și datele și controlul sunt activate, se folosește o săgeată aldine În timp ce proiectanții de procesoare pot folosi orice tip de magistrală pentru un cip, trebuie aplicate reguli clare despre modul în care funcționează magistrala; și toate dispozitivele conectate la magistrală trebuie să respecte aceste reguli pentru ca plăcile fabricate de terți să se potrivească cu magistrala de sistem Aceste reguli se numesc protocol autobuz În plus, trebuie să existe anumite cerințe tehnice pentru ca plăcile de la alți producători să se potrivească în șinele PCB și să aibă conectori care se potrivesc mecanic cu placa de bază, în ceea ce privește tensiunile, sincronizarea, etc Unele magistrale nu au specificații mecanice, deoarece sunt concepute pentru poate fi utilizat fie cu circuite integrate, de exemplu, pentru a interconecta componente pe sisteme cu un singur cip (SoC) Există o serie de autobuze utilizate pe scară largă în lumea computerelor, cum ar fi: Omnibus (PDP- ), Unibus (PDP- ), Multibus ( ), VME (echipament de laborator fizic), IBM PC (PC/XT), ISA (PC/AT), EISA ( ), Microchannel (PS/ ), Nubus (Macintosh), PCI (diverse computere personale), SCSI (diverse computere personale și stații de lucru), Universal Serial Bus (calculatoare personale moderne), FireWire (electronice de uz casnic) Poate că lucrurile ar fi mult mai ușor dacă toate cauciucurile, cu excepția uneia sau două, ar dispărea de pe suprafața pământului Din păcate, standardizarea în acest domeniu pare foarte puțin probabilă, deoarece toate aceste pietre prețioase incompatibile au fost deja investite prea mult Să începem cu cum funcționează vârfurile Unele dispozitive conectate la magistrală sunt active și pot iniția trimiterea de informații, în timp ce altele sunt pasive și așteaptă solicitări Dispozitivul activ se numește master, dispozitivul pasiv se numește slave Când CPU solicită controlerului de disc să citească sau să scrie un bloc de informații, CPU acționează ca master și controlerul de disc acționează ca slave Controlerul de disc poate acționa ca un master atunci când spune memoriei să accepte cuvintele pe care le-a citit de pe disc Câteva combinații tipice master și slave sunt enumerate în Tabelul , Memoria nu poate fi în niciun caz un dispozitiv principal Tabelul Exemple de maestru și sclav Dispozitiv master Dispozitiv slave Exemplu Memoria CPU Apelarea comenzilor și a datelor Dispozitiv I/O CPU Inițializează transferul de date Unitate centrală de procesare Coprocesor Trimiterea unei comenzi de la procesor la coprocesor Dispozitiv I/O Memorie DMA CPU coprocesor Coprocesorul apelează operanzi de la CPU Semnalele binare produse de dispozitivele computerizate adesea nu au suficientă putere pentru a activa magistrala, mai ales dacă este suficient de lungă și dacă la el sunt conectate multe dispozitive Din acest motiv, majoritatea șoferilor de autobuz sunt de obicei conectați la magistrală printr-un cip numit driver de autobuz, care este în esență un amplificator digital În mod similar, majoritatea dispozitivelor slave sunt conectate la magistrală printr-o chiuvetă de magistrală Pentru dispozitivele care pot fi atât master cât și slave, se folosește un transceiver magistrală sau transceiver Aceste cipuri, concepute pentru a interacționa cu autobuzul, sunt adesea dispozitive cu trei stări, oferindu-le posibilitatea de a se detașa atunci când nu sunt necesare Uneori, acestea sunt conectate printr-un colector deschis, ceea ce va da un efect similar Când unul sau mai multe dispozitive colectoare deschise solicită accesul la magistrală în același timp, rezultatul este o operație booleană OR pe toate aceste semnale Un astfel de acord se numește SAU de montaj Pe majoritatea autobuzelor, unele linii sunt dispozitive tri-state, iar altele care necesită o proprietate cu fir SAU sunt open-collector La fel ca și procesorul, vârful are linii de adresă, informații și control Cu toate acestea, este posibil să nu existe o corespondență unu-la-unu între pinii procesorului și semnalele magistralei De exemplu, unele procesoare au trei pini care oferă un semnal de citit sau de scris în memorie, de a citi dispozitivul de la I/O, de a scrie pe un dispozitiv de I/O sau de a efectua o altă operație O magistrală normală poate conține o linie pentru citirea din memorie, o a doua pentru scrierea în memorie, o a treia pentru cipuri și cipuri de procesor a ■ w ■I (' dispozitive de intrare-ieșire, al patrulea - pentru scrierea pe dispozitivul de intrare-■і etc Apoi procesorul ar trebui să fie conectat la o astfel de magistrală printr-un cip-■f poate conduce linii de magistrală Designul și principiile de funcționare ale anvelopelor sunt destul de complexe wonro-|| Au fost scrise o serie de cărți pe acest subiect [Anderson et al , ; Solari și Willse, Principalele probleme de proiectare sunt lățimea autobuzului, fonizarea autobuzului, arbitrarea autobuzului și performanța autobuzului Toate aceste na-Tstry afectează semnificativ debitul autobuzului În următoarele subsecțiuni, vom lua în considerare fiecare dintre ele ■Anvelope Irina ■Irina (numărul de linii de adresă) al magistralei este cel mai evident parametru la ■Activare Cu cât magistrala conține mai multe linii de adresă, cu atât mai multă memorie poate accesa procesorul Dacă magistrala conține n adrese ■VIY-uri, atunci procesorul o poate folosi pentru a accesa CI-uri de memorie diferite de inchi Memoria de mare capacitate necesită o mulțime de adrese ■NIU Totul pare a fi simplu Problema este că pentru anvelopele late este nevoie de mai mult pentru anvelopele înguste Ocupă mai mult spațiu fizic (de exemplu, pe o placă de bază) și necesită conectori mai mari Toți factorii III fac o anvelopă scumpă Prin urmare, trebuie făcut un compromis între cantitatea maximă de memorie disponibilă și costul sistemului Un sistem cu o magistrală care conține de linii de adresă și o memorie de de octeți va fi mai scump decât un sistem cu o magistrală care conține de linii de adresă și o astfel de memorie de de octeți Extinderea ulterioară nu este gratuită Mulți designeri de sisteme au fost miopi, cu consecințe nefericite Primul model de PC IBM conținea procesorul ȘI un vârf de adresă de de biți (Fig , a) Autobuzul a permis accesul la MB de memorie adresa pe de biți adresa pe de biți adresa pe de biți Control Control adresa pe biți Control adresa pe biți Adresă de management pe biți Control l Control în Orez Extinderea magistralei de adrese în timp Când a sosit următorul procesor ( ), Intel a decis să mărească spațiul de adrese la MB, așa că au trebuit adăugate încă linii (păstrând cele inițiale din motive de compatibilitate inversă), așa cum se arată în Figura b Din păcate, au trebuit adăugate și linii de control pentru noile linii de adresă Când a apărut procesorul , au fost adăugate încă linii de adresă și, desigur, mai multe linii de control, așa cum se arată în Fig , c Rezultatul este un autobuz EISA Cu toate acestea, arhitectura s-a dovedit a fi mult mai complicată decât dacă ar fi fost folosite de linii de la bun început În timp, nu doar numărul liniilor de adresă crește, ci și numărul liniilor de informații, deși acest lucru se întâmplă dintr-un motiv diferit Există două moduri de a crește lățimea de bandă a magistralei: reduceți timpul ciclului magistralei (efectuați mai multe transferuri pe secundă) sau măriți lățimea magistralei de date (adică creșteți numărul de biți transferați pe ciclu) Este posibil să creșteți viteza autobuzului, dar este destul de dificil să faceți acest lucru, deoarece semnalele pe diferite linii sunt transmise la viteze diferite (acest fenomen se numește declin de magistrală) Cu cât circula mai repede autobuzul, cu atât este mai mare declinarea Pe măsură ce viteza autobuzului crește, apare o altă problemă: în acest caz, acesta devine incompatibil cu versiunile anterioare Plăcile mai vechi concepute pentru autobuzul mai lent nu se pot descurca pe cel nou Această situație este dezavantajoasă pentru proprietarii și producătorii de plăci vechi Prin urmare, este obișnuit să adăugați pur și simplu linii noi pentru a crește productivitatea, așa cum se arată în Fig După cum vă puteți imagina, acest lucru are și dezavantajele sale IBM PC și succesorii săi, de exemplu, au început cu linii de date, apoi au trecut la , apoi de linii, toate pe aceeași magistrală Pentru a rezolva această problemă, dezvoltatorii preferă uneori magistrala multiplex În acest autobuz nu există o împărțire în linii de adresă și informații O plată poate avea, de exemplu, de linii atât pentru adrese, cât și pentru date Aceste linii sunt folosite mai întâi pentru adrese, apoi pentru date Pentru a scrie informații în memorie, trebuie mai întâi să transferați adresa în memorie, apoi datele În cazul liniilor separate, adresele și datele pot fi transmise împreună Îmbinarea liniilor reduce lățimea și costul autobuzului, dar sistemul este mai lent Prin urmare, designerii trebuie să cântărească argumentele pro și contra înainte de a face o alegere Ora autobuzului Anvelopele pot fi împărțite în două categorii în funcție de momentul lor Autobuzul sincron conține o linie care este condusă de un oscilator cu cristal Semnalul pe această linie este o undă pătrată cu o frecvență de obicei de la la MHz Orice acțiune de magistrală necesită un număr întreg de așa-numitele cicluri de magistrală Magistrala asincronă nu conține un oscilator principal Ciclurile magistralei pot fi arbitrare și nu sunt neapărat aceleași pentru toate perechile de dispozitive În continuare, vom lua în considerare fiecare tip de anvelopă separat Ciclu de citire cu o singură perioadă de așteptare Timp A Valoarea Oimmol Unități minime maxime L Întârziere Adresă ns *m, Interval între stabilizarea adresei și setarea semnalului MREQ HC Intervalul dintre scăderea semnalului de ceas în ciclul T și setarea semnalului MREQ NS і", Intervalul dintre declinul semnalului de sincronizare în ciclul Tt și setarea semnalului RD NS Perioada de transmisie înainte de scăderea ceasului ns min Întârziere între scăderea semnalului de ceas în ciclul T și resetarea semnalului MREQ ns Intervalul dintre declinul semnalului de sincronizare în ciclul T și resetarea semnalului RD NS ІІІ Perioada de continuare a transmisiei de date din momentul resetarii semnalului RD ns b Orez Diagrama de timp a procesului de citire pe magistrala sincronă (a); anumite caracteristici temporale ale procesului de citire pe o magistrală sincronă (b) Anvelope sincrone Ca exemplu al modului în care funcționează o magistrală asincronă, luați în considerare diagrama de timp din Fig În acest exemplu, vom folosi un driver de MHz, care oferă un ciclu de magistrală de ns Deși poate părea că magistrala este lentă în comparație cu procesoarele de GHz și mai mari, nu multe autobuze moderne sunt mai rapide De exemplu, populara magistrală PCI a funcționat la MHz sau MHz, în timp ce magistrala PCI-X îmbunătățită (dar nu mai este utilizată) a funcționat la MHz Motivele vitezei reduse a anvelopelor moderne au fost deja discutate: ele includ probleme tehnice precum deformarea autobuzului și nevoia de compatibilitate În exemplul nostru, presupunem că citirea informațiilor din memorie durează ps din momentul în care adresa este setată După cum vom vedea în curând, este nevoie de trei cicluri de autobuz pentru a citi un cuvânt Primul ciclu începe în partea din față a segmentului Tr, iar al treilea ciclu se termină în partea din față a segmentului T , așa cum se arată în Fig Rețineți că niciuna dintre creșteri și căderi nu sunt desenate vertical, deoarece niciun semnal electric nu își poate schimba valoarea în timp zero În exemplul nostru, presupunem că este nevoie de ns pentru ca semnalul să se schimbe Generatorul și liniile de adresă și date, precum și liniile MREQ, RD, WAIT sunt afișate* pe aceeași scară de timp Începutul lui T este determinat de partea frontală a generatorului În timpul T, CPU plasează adresa cuvântului dorit pe liniile de adresă Deoarece o adresă nu este o singură valoare (spre deosebire de un generator), nu o putem afișa ca o singură linie în diagramă În schimb, am arătat-o ca două linii cu intersecții în care această adresă se schimbă Culoarea gri de pe diagramă arată că în acest moment nu contează ce valoare a primit semnalul Folosind aceeași convenție, vedem că conținutul liniilor de date este irelevant până la segmentul Tj După ce liniile de adresă au posibilitatea de a dobândi o nouă valoare, semnalele MREQ și RD sunt setate Primul indică faptul că se accesează memoria și nu dispozitivul I/O, iar al doilea indică faptul că citirea este în curs, nu scrierea Deoarece este nevoie de ns (parte a primului ciclu) pentru a citi informațiile din memorie după setarea adresei, memoria nu poate transfera datele necesare în perioada T Pentru a împiedica CPU să aștepte sosirea datelor, memoria setează semnalul WAIT la începutul segmentului T Aceasta înseamnă introducerea unor perioade de așteptare (cicluri suplimentare de magistrală) până când memoria resetează semnalul WAIT În exemplul nostru, este introdusă o perioadă de așteptare (T ), deoarece memoria este prea lentă La începutul segmentului T , când există încredere că memoria va primi date în timpul ciclului curent, semnalul WAIT este resetat În prima jumătate a T , memoria plasează date pe liniile de informații La declinul segmentului T , procesorul central strobocizează (adică citește) liniile de informații, stocând valorile acestora în registrul intern După citirea datelor, procesorul resetează semnalele MREQ și RD Dacă este necesar, un alt ciclu de memorie poate începe pe marginea următoare Această secvență poate fi repetată la infinit II specificația de sincronizare din fig , condițional iPn p'iens sunt utilizate Tw, de exemplu, este intervalul de timp dintre muchia ascendentă a lui T, în colțul liniilor de adresă Conform cerințelor de sincronizare I ns Aceasta înseamnă că producătorul procesorului garantează că în timpul celui de-al doilea ciclu de citire, procesorul central va putea emite n critul necesar în ns de la mijlocul frontului Tr Condițiile de sincronizare necesită, de asemenea, ca datele să sosească pe liniile de date cu cel puțin ns (TDS) înainte de rularea T pentru a da timpului de date v |n , I Hz și o lățime de linie de de nanometri Conceptul de „lățime de linie” denotă lățimea conductorilor dintre tranzistori (și, în același timp, determină lățimea tranzistorilor înșiși) Cu cât această valoare este mai mică, cu atât mai mulți tranzistori se potrivesc pe un cip În esență, legea lui Moore prezice capacitatea inginerilor de a reduce și mai mult lățimea liniei Printre altele, reducerea acestei valori vă permite să creșteți frecvența ceasului Pentru comparație, /іvmetrul unui păr uman este de - de microni (mai mult, părul blond nu este închis la culoare) Lansarea originală a arhitecturii Coge i a fost bazată pe arhitectura „Nahalem”, dar noile versiuni ale arhitecturii Coge i se bazează pe arhitectura mai nouă „Sandy lliidge” Termenul „arhitectură” în acest context se referă la desemnarea internă a procesorului central, căruia i se atribuie adesea o cale de cod De obicei, arhitecții de calculatoare sunt oameni serioși și uneori vin cu fragmente de cod foarte spirituale pentru proiectele lor De exemplu, arhitecturile din seria K de la AMD trebuiau să distrugă poziția aparent invulnerabilă a lui Intri pe piața procesoarelor desktop Pentru procesoarele din seria K s-a ales numele de cod „Kryptonite” - numele singurei substanțe care l-ar putea dăuna lui Superman, un indiciu plin de duh asupra dominației Intel Noua versiune Core I bazată pe arhitectura Sandy-Bridge a crescut la , miliarde de tranzistori Funcționează la o viteză de , GHz cu o lățime de linie de nanometri Deși Core i este foarte diferit de procesorul cu cei de tranzistori ai săi, este pe deplin compatibil cu și poate rula programe binare scrise pentru (ca să nu mai vorbim de programele pentru toate procesoarele care au apărut între Core i și ) Din punct de vedere software, Coge I este o mașină pe de biți Suportă aceeași arhitectură standard industrială (ISA) ca și procesoarele , , Pentium, Pentium II, Pentium Pro, Pentium III și Pentium , inclusiv aceleași registre, aceleași instrucțiuni și aceeași procesare în virgulă mobilă încorporată standard IEEE În plus, Cor i are noi comenzi destinate în principal operațiunilor criptografice Core I este un procesor multi-core; astfel, substratul de siliciu conține mai multe procesoare Se vinde cu un număr diferit de procese interne - de la la (și numărul acestora ar trebui să crească în viitorul apropiat) Dacă programatorii scriu un program paralel folosind fire și blocări, organizarea execuției paralele pentru mai multe Unele procesoare vor oferi un câștig semnificativ în viteză, este acceptată tehnologia hyper-threading, care permite ca mai multe fire hardware să fie active în același timp Hyperthreading permite comutarea firelor hardware în timpul întârzierilor foarte scurte (de exemplu, pierderile de cache) Comutarea firelor de execuție software poate avea loc numai în timpul întârzierilor foarte mari (cum ar fi erorile de pagină) deoarece implementarea en> necesită sute de cicluri La nivel de microarhitectură, Coge I se bazează pe arhitectura predecesorilor săi Core și Core Duo Procesorul Core I poate executa până la patru instrucțiuni simultan, ceea ce face posibil să îl consideri o mașină superscalară de x Microarhitectura lui Coré i va fi discutată în capitolul Procesoarele Coge i folosesc un cache pe trei niveluri Fiecare procesor Coge I are un cache de date L de KB și un cache de instrucțiuni L de KB Fiecare nucleu are, de asemenea, propriul cache L de KB Cache-ul de al doilea nivel este unificat, adică vă permite să stocați o combinație de comenzi și date Toate nucleele partajează un cache unificat de Nivel (L ), care are o dimensiune de până la MB, în funcție de modelul procesorului Cacheul pe trei niveluri îmbunătățește semnificativ performanța procesorului, dar datorită creșterii costului componentelor din siliciu, deoarece cantitatea totală de cache pe un substrat nu poate depăși MB în procesoarele Coge I Deoarece toate cipurile Coge I conțin mai multe procesoare cu propriile cache de date, poate fi dificil pentru unul dintre procesoare să modifice un cuvânt plasat în memoria cache privată Dacă, să zicem, un alt procesor încearcă să citească acest cuvânt din memorie, acesta va obține o valoare învechită, deoarece trece un timp între schimbarea cuvântului și scrierea acestuia în memorie Pentru a menține consistența datelor în memorie, fiecare CPU dintr-un sistem multiprocesor monitorizează magistrala de memorie pentru cererile de cuvinte stocate în cache Dacă o astfel de solicitare este detectată, procesorul furnizează datele necesare înainte ca memoria să le transfere altor consumatori Tehnologia de urmărire va fi tratată în Capitolul Sistemele cu procesor Coge i folosesc două magistrale externe, ambele sunt sincrone Bus-ul de memorie DDR este folosit pentru a accesa memoria RAM dinamică principală; Bus PCI Express - pentru interacțiunea cu dispozitivele de intrare-ieșire Versiunile de înaltă performanță ale Coge i conțin mai multe magistrale de memorie și PCI Express, precum și un port QPI (Quick Path Interconnect) Portul QPI conectează procesorul la o conexiune externă multiprocesor, ceea ce deschide posibilitatea de a construi sisteme cu mai mult de șase procesoare Portul QPI trimite și primește solicitări de coerență a memoriei cache, precum și alte mesaje de control pentru sistemele multiprocesor, cum ar fi întreruperile interprocesor Principala problemă cu Coge i , ca și cu toate procesoarele desktop moderne, este cantitatea de energie consumată și căldura generată Pentru a evita deteriorarea componentelor din siliciu, este necesar să eliminați căldura din procesor imediat după ce este generată Procesoarele Coré i consumă de la la wați în funcție de frecvență și model De aceea hih I sunt într-o căutare constantă de noi soluții care să permită > p» și ѵ să se bucure de problema degajării căldurii Tehnologiile de răcire și transferul de căldură al pachetului joacă un rol important în protejarea împotriva arderii siliciului siliciu Chipurile Coge I sunt furnizate într-un pachet LGA pătrat cu o lungime de , mm Există tampoane pe planul inferior al microcircuitului, iar dintre ele sunt utilizate pentru alimentarea cu energie, iar sunt împământate în scopul suprimării zgomotului Tampoanele sunt plasate sub forma unei matrice de x , iar segmentul său Hi și IV x nu este umplut În plus, alte de locuri au fost ratate de-a lungul perimetrului asimme-іrіenіo, din cauza cărora este exclusă posibilitatea ♦ și montarea corectă a microcircuitului în priză Dispunerea fizică a Cor і și і pii trei Rust fig **************** *************** **************** **** ************ ************************************ * ******** ** ************ ***** * **** * *** * ************** ** ************************************************ *** ************ ************************************ *** * * * ********* ***** ** **** * ****** **** *** ********** ****** ******************** ******** pWWWWWWAV- Itil *##**%** IV FII ІІІ INI ***** ІІІ |«| iftl III #### * - Diagnosticare *—h—Controlul temperaturii - M I este similară cu PCI Express, deși funcționează la jumătate din viteza acestuia din urmă, deoarece patru căi pot oferi o rată de transfer de numai până la , GB/s de date Chipsetul conține suport complet pentru interfețe I/O suplimentare necesare în mod normal pentru sistemele de înaltă performanță cu mai multe dispozitive I/O suport pentru SATA, USB, interfețe audio, PCIe și memorie flash ICH oferă suport pentru interfețele vechi, inclusiv interfața PCI și funcționalitatea controlerului de întrerupere A Acces la memorie (DMA) Existența unor astfel de cipuri simplifică foarte mult asamblarea unui computer personal cu drepturi depline calculator Coge I poate implementa întreruperi în același mod ca și (acest lucru din motive de compatibilitate) sau poate utiliza noul sistem de întrerupere cu dispozitivul Advanced Programmable Interrupt Controller (APIC) Core I poate funcționa la oricare dintre mai multe tensiuni prestabilite, dar procesorul trebuie să știe la ce tensiune va funcționa Semnalele de gestionare a puterii sunt utilizate pentru a selecta automat tensiunea de alimentare, pentru a notifica procesorului despre stabilitatea puterii și pentru o serie de alte operațiuni conexe Cu ajutorul lor, se realizează tranziția la diferite stări de somn, care, desigur, sunt unul dintre instrumentele de gestionare a energiei În ciuda mecanismului complex de gestionare a puterii, temperaturile Coge I pot atinge valori foarte mari Un grup de semnale de control al temperaturii permite procesorului să alerteze dispozitivele din jur despre pericolul supraîncălzirii Aceasta include, de exemplu, un semnal dat de CPU atunci când temperatura sa internă depășește °C ( °F) Deși ('dacă temperatura procesorului depășește ° C, probabil că visează deja la pensionare și la un serviciu conștiincios ca încălzitor Cu toate acestea, chiar și la temperaturi atât de exorbitante, nu trebuie să vă faceți griji cu privire la siguranța lui Coge I Dacă senzorii interni detectează că procesorul este pe cale să se supraîncălzească, aceștia declanșează reglarea termică, mecanism care st|X) care reduce generarea de căldură datorită faptului că procesorul funcționează numai în fiecare N-lea ciclu Cu cât valoarea lui N este mai mare, cu atât îngheață mai mult și se răcește mai repede Desigur, trebuie să plătiți pentru termoreglare prin reducerea performanței sistemului Înainte de invenția termoreglării, în cazul răcirii insuficient eficiente, procesorul s-a ars Dovezi ale „vremurilor întunecate” ale controlului temperaturii pot fi găsite pe YouTube (căutați „procesor care explodă”) Videoclipul este fals, dar problema este reală, Semnal Un grup de semnale de ceas este responsabil pentru determinarea frecvenței magistralei sistemului Grupul de semnale de diagnosticare este destinat testării și depanării sistemelor conform standardului IEEE JTAG Grupul de semnale de inițializare servește la încărcarea (pornirea) sistemului Semnalul CK este utilizat de procesor pentru a genera diverse impulsuri de ceas la multipli sau fracțiuni ale ceasului sistemului Pentru a face acest lucru, se folosește un dispozitiv numit sistem de buclă blocată cu întârziere sau DLL (Delay-Locked Loop) Grupul de semnale de diagnosticare este destinat testării și depanării sistemelor conform standardului IEEE JTAG (Joint Test Action Group) În cele din urmă, grupul „alte semnale” include semnale eterogene utilizate în diverse scopuri speciale Modul pipelining al magistralei de memorie a procesorului Core i Procesoarele moderne, precum Coge i , au cerințe stricte pentru memoria dinamică Acestea rulează mult mai repede decât poate produce valori ale memoriei dinamice lente, iar această problemă este exacerbată atunci când mai multe procese emit solicitări simultane Pentru ca procesorul să nu funcționeze, este necesară cea mai mare performanță posibilă a memoriei Din acest motiv, magistrala de memorie a procesorului Coré I DDR funcționează în modul pipeline, atunci când pe magistrală au loc până la patru operațiuni simultan Am discutat despre conceptul de pipeline în Capitolul când am vorbit despre procesoare pipeline (vezi Figura ), dar memoria poate fi, de asemenea, pipeline Pentru a face posibil modul pipeline, solicitările către memoria Core I constau în trei etape: Faza de activare a memoriei (ACT) „deschide” linia de memorie dinamică, făcând-o pregătită pentru accesări ulterioare În faza de citire (READ) sau scriere (WRITE), cuvintele individuale ale unei linii de memorie dinamică deschisă sau cuvintele succesive ale liniei curente de memorie dinamică pot fi accesate utilizând modul batch Faza de preîncărcare (PCHRG) „închide” linia curentă a memoriei dinamice și pregătește memoria pentru următoarea comandă de activare Lucrarea pipeline cu memoria procesorului Core I se bazează pe faptul că memoria dinamică DDR pe un microcircuit este formată din mai multe bănci O bancă este un bloc de memorie dinamică care poate fi accesat de procesor în paralel cu alte bănci, chiar și cele situate pe același cip Un cip obișnuit de memorie dinamică DDR conține până la opt bănci Cu toate acestea, specificația interfeței DDR nu permite mai mult de Exemple de priorități centrale Accesuri paralele іrex pentru un canal DDR Diagrama de timp-R fig Figura arată cum Codul I emite apeluri către trei bănci de memorie diferite Accesurile sunt complet suprapuse, astfel încât operațiunile AI pe cipul de memorie dinamică sunt executate în paralel Comunicarea cu comenzile și operațiile ulterioare pe diagrama de timp Săgeți Sh'tsya Autobuz Autobuz O Rio Accesări de memorie prin pipelining prin interfața DDR a procesorului Core I După cum se poate observa din fig , interfața de memorie DDR are patru canale principale de semnal: ceas magistrală (CK), comandă magistrală (CMD), adresă (ADDR) și date (DATE) Semnalul ceasului magistralei CK controlează întreaga funcționare a magistralei Semnalul de comandă CMD indică ce operație este solicitată din memoria dinamică Comanda ACT setează adresa liniei DRAM deschisă de semnalul ADDR La executarea comenzii READ, adresa unei coloane de memorie dinamică este setată folosind semnalele ADDR, iar memoria dinamică emite valoarea citită după un timp fix prin semnalele DATA În cele din urmă, instrucțiunea PCHRG specifică banca căreia i se aplică operația de preîncărcare prin semnalele ADDR În exemplul nostru, comanda ACT trebuie să precedă prima comandă READ pentru aceeași bancă cu două cicluri de vârf DDR , iar datele sunt emise un ciclu după comanda READ În plus, operațiunea PCHRG trebuie să aibă loc la cel puțin două cicluri după ultima operațiune READ pe același banc de heap Paralelismul solicitărilor de memorie se manifestă prin suprapunerea solicitărilor READ către diferite bănci de memorie dinamică Primele două READ-uri către băncile și se suprapun complet, producând rezultate pe ciclurile de magistrală și, respectiv, Apelul banca se suprapune cu primul apel bancar , iar în final a doua citire din banca se suprapune cu apelul banca Cum știe Core I când să se aștepte la returnarea datelor de comandă RI'AD și când să emită o nouă solicitare de memorie? Pentru a face asta, el iiiist simulare completă a activității interne a fiecărui cip DDR conectat În consecință, se așteaptă ca datele să fie returnate într-un ciclu ales corespunzător și știe că operațiunea de preîncărcare nu ar trebui să înceapă decât după două cicluri de la ultima operațiune de citire Coge I poate prezice toate aceste evenimente, deoarece interfața de memorie DDR rulează sincron, astfel încât toate operațiunile necesită un număr bine definit de cicluri de magistrală DDR Chiar și cu toate aceste informații, construirea unei interfețe de memorie DDR de înaltă performanță, complet pipeline, nu este o sarcină banală, necesitând numeroase temporizatoare interne și detectoare de coliziune pentru a implementa procesarea eficientă a cererilor Sistem cu un singur cip Texas Instrumente OMAP Ca al doilea exemplu de procesor, să luăm sistemul Texas Instruments (TI) OMAP cu un singur cip OMAP implementează setul de instrucțiuni ARM, iar domeniul său principal de aplicare este sistemele mobile și încorporate - smartphone-uri, tablete, gadget-uri de internet Un sistem cu un singur cip include o gamă largă de astfel de dispozitive, astfel încât atunci când sunt combinate cu periferice fizice (ecran tactil, memorie flash), se formează un dispozitiv de computer cu drepturi depline OMAP include două nuclee ARM A , acceleratoare suplimentare și numeroase interfețe periferice Organizarea internă a OMAP este prezentată în fig Miezurile ARM A aparțin unei microarhitecturi superscalare cu lățime Substratul OMAP găzduiește și alte trei procesoare acceleratoare: procesorul grafic POWERVR SGX , un procesor de procesare a imaginii (ISP, Image Signal Proccssor) și un accelerator multimedia IVA SGX - oferă un accelerator multimedia eficient vizualizare programabilă ) și poate fi văzută ca analogă cu GPU-urile desktop (deși inferioare acestora în ceea ce privește viteza și puterea) Procesor programabil SP pentru procesarea eficientă a imaginii (operații necesare în camerele digitale puternice) IVAZ implementează codificare și decodare video eficiente, cu performanțe suficiente pentru a suporta aplicații D (cum ar fi dispozitivele portabile de jocuri) De asemenea, sistemul OMAP cu un singur cip conține o gamă largă de interfețe periferice, inclusiv ecrane tactile și controlere cu tastatură, interfețe de memorie dinamică și flash, USB și HDMI Texas Instruments a publicat planuri pentru dezvoltarea seriei de procesoare OMAP Arhitecturile viitoare vor avea cele mai multe - mai multe nuclee ARM, GPU-uri și o varietate de periferice Sistemul OMAP cu un singur cip a apărut pentru prima dată la începutul anului Opa avea două nuclee ARM A care rulau la GHz folosind o implementare de de metri O caracteristică cheie a procesorului OMAP este că efectuează o cantitate semnificativă de calcul cu un consum foarte scăzut de energie, deoarece se concentrează pe dispozitivele mobile alimentate cu baterie Cu cât este mai eficientă arhitectura unui dispozitiv mobil, cu atât mai rar va trebui să pună dispozitivul la încărcare Exemple de procese centrale BARAJ IHOM ■MIG LFDOR •nd L DMM tІgy MMNx KBL XV L IVA-HD P KB SL GPMC extern NAND/NOR EMIF LPDDR ( MHz) SGX D/ D Modem extern sau accelerator o cm O С С MHz (DDR) Afișaj DSS (DSI/HDMI) CM co co CM co co USB-HS porturi USB-HS Gazdă SDMA Procesarea imaginii Extins» şi ISP SIMCOP UNIPRO Ducati Mhz HSI Bus intern de mare viteză cu suport pentru memorie multicanal RAM L pe cip KV Depanare și urmărire DAP MMCSD (cu DMA) DDR pe biți CryptoDMA Aoceleratoare de securitate AES/SHA J Periferia L Per / emu / coge / abe cm co O Nutriție Resetați gestionarea sincronizării co Ș cb P£U-o O cinci Orez Structura internă a sistemului cu un singur cip OMAR Procesoarele OMAP au fost selectate cu scopul de a atinge obiectivul principal al consumului de energie IIaco'o GPU-ul, ISP-ul și IVAZ sunt singurele acceleratoare programabile care efectuează calcule eficient la un consum de energie semnificativ mai mic în comparație cu efectuarea acelorași calcule direct pe procesoarele ARM A La consumul maxim de energie, OMAP utilizează doar mW de putere Acesta este aproximativ / din consumul de energie al unui Core I de înaltă performanță OMAP implementează, de asemenea, un mod de repaus foarte eficient; când toate componentele intră în stare de repaus, consumul de energie este de doar de microwați Modurile de repaus eficiente sunt foarte importante pentru dispozitivele mobile care petrec mult timp în modul de așteptare (cum ar fi telefoanele mobile) Cu cât este mai puțină energie consumată în modul de repaus, cu atât telefonul mobil poate rămâne mai mult în standby Pentru a reduce și mai mult consumul de energie, arhitectura OMAP include diverse funcții de gestionare a energiei, inclusiv scalarea dinamică a tensiunii și limitarea puterii Scalarea dinamică a tensiunii permite componentelor să funcționeze mai lent la tensiuni mai mici, reducând foarte mult cerințele de putere Dacă nu aveți nevoie de procesor pentru a efectua calcule la viteză maximă, tensiunea poate fi scăzută - procesorul funcționează mai lent, economisind o cantitate semnificativă de energie Mecanismul de pornire a puterii folosește un principiu și mai activ de gestionare a puterii: o componentă neutilizată este complet oprită și nu consumă energie De exemplu, atunci când utilizatorul nu vizionează un videoclip pe o tabletă, procesorul video IVAZ este complet oprit și nu consumă energie Și invers, în timp ce vizionați IVAZ, efectuează intens munca de decodare a fluxului video, iar două nuclee ARM A „adorm” ! În ciuda specializării lor (economii de energie), nucleele ARM L folosesc o microarhitectură destul de puternică Pentru fiecare ciclu, ei pot decoda și executa până la două instrucțiuni După cum vom afla în capitolul , această viteză de execuție este cea care maximizează performanța microarhitecturii Dar nu trebuie să presupuneți că exact atât de multe comenzi vor fi executate pentru fiecare ciclu de ceas Mai degrabă, este performanța maximă garantată de producător; un nivel care nu va fi depășit de procesor sub nicio formă În multe cicluri de ceas, vor fi executate mai puțin de două instrucțiuni; acest lucru se datorează prezenței „obstacolelor” care încetinesc execuția comenzilor și reduc performanța generală a sistemului Pentru a elimina astfel de constrângeri, ARM A încorporează un sistem puternic de predicție a ramurilor, un planificator de instrucțiuni de resecvențiere și un sistem de memorie extrem de optimizat Sistemul de memorie OMAP conține două cache interne L pentru fiecare dintre procesoarele ARM A ; Cache de instrucțiuni de K și cache de date de K Cache-urile sunt deservite de canale LPDDR duble de putere redusă Standardul LPDDR este un derivat al interfeței standard de memorie DDR , dar utilizează mai puțini conductori și funcționează la tensiuni mai eficiente din punct de vedere energetic În plus, controlerul de memorie conține o serie de optimizări (cum ar fi preluarea prealabilă și suportul de rotație) Deși stocarea în cache va fi tratată în detaliu în Capitolul , merită și acum câteva cuvinte Toată memoria principală este împărțită în linii cache (blocuri) formate din de octeți Primul nivel cache stochează cele de linii de instrucțiuni cele mai utilizate și cele de linii de date cele mai utilizate Liniile cache care sunt intens utilizate, dar nu se potrivesc în cache-ul de primul nivel sunt stocate în cache-ul de al doilea nivel Acest cache conține atât linii de date, cât și linii de comandă de la ambele procesoare ARM A amestecate într-un mod arbitrar Cache-ul de al doilea nivel conține de linii de memorie principală care au fost accesate ultima dată La o pierdere a memoriei cache de la primul nivel, procesorul trimite identificatorul de linie căutată în memoria cache de nivel al doilea Răspunsul conține informații prin care procesorul poate determina dacă linia specificată este stocată în memoria cache de nivel al doilea și, dacă este stocată, în ce stare Dacă linia este în cache, procesorul o primește Obținerea datelor din memoria cache de al doilea nivel durează cicluri Așteptarea este destul de lungă, așa că programatorii calificați optimizează („urlă” programul astfel încât să folosească mai puține date; crescând astfel probabilitatea ca datele să se afle într-un cache rapid de prim nivel Dacă o linie de cache nu se află în memoria cache L , aceasta este încărcată din memoria principală prin interfața de memorie LPDDR Interfața LPDDR din OMAP este pe cip, permițând OMAP să comunice direct cu memoria dinamică Pentru a accesa memoria, procesorul trimite mai întâi partea superioară a adresei către cipul de memorie dinamică de-a lungul a linii de adrese Această operație, numită „activare” (ACTIVARE), încarcă întreaga linie de memorie din memoria dinamică în buffer-ul de linie În consecință, procesorul poate emite mai multe comenzi READ sau WRITE, trecând restul adresei pe aceleași linii de adresă și trimițând (sau primind) date pentru operarea pe de linii de date Exemple de procesoare În așteptarea rezultatelor, procesorul poate face alte lucrări De exemplu, o pierdere a memoriei cache în timpul preluării instrucțiunilor nu împiedică executarea uneia sau a mai multor instrucțiuni deja preluate, fiecare dintre acestea putând implica date care nu se află în nicio memorie cache În acest fel, chiar și un procesor poate avea mai multe tranzacții nefinalizate pe două interfețe LPDDR Controlerul de memorie /Іініжэіі urmărește evenimentele curente și emite solicitări în memorie cel mai mult și eu sunt în ordinea următoare Datele din memorie pot veni în bucăți de octeți O operație de memorie poate folosi o citire sau o scriere în modul batch, care anulează sau scrie mai multe adrese contigue într-o singură linie de memorie dinamică Acest mod este eficient în special pentru citirea sau scrierea blocurilor cache Descrierea OMAP dată mai sus (precum și descrierea care o precedă (ne і ) este mult simplificată, dar esența a ceea ce se întâmplă este reflectată în ea Cipul OMAP conține de pini într-un pachet BGA (Fig ) Pachetul BGA (Bal! Grid Aggau) este similar cu LGA, dar în loc de plăcuțele pătrate neutilizate în LGA, folosește bile mici de metal Dgp două tipuri de cazuri sunt incompatibile, ceea ce demonstrează încă o dată pe bună dreptate zicala „nu poți astupa o gaură rotundă cu un dop pătrat” Pinii OMLR formează o matrice dreptunghiulară de x , în care conține două inele interioare de bile, precum și două sub-rânduri și semi-coloane asimetrice pentru a elimina posibilitatea instalării incorecte a microcircuitului în priza BGA Orez Cip al sistemului cu un singur cip OMAP Este dificil să compari un cip CISC (cum ar fi Cope I ) cu un cip RISC (cum ar fi OMAP ) doar pe baza vitezei de ceas De exemplu, V din două nuclee ARM A , viteza maximă de execuție atinge patru instrucțiuni per iact; în acest sens, OMAP aproape se compară cu procesoarele superscalare cu lățimi ale lui Cope i Cu toate acestea, Coge i rulează programe mai rapid, deoarece conține până la șase procesoare, tactate de , ori mai rapid ( , GHz) decât OMAP Poate părea că OMAP seamănă cu o țestoasă care încearcă să depășească un iepure de câmp Coge i , dar țestoasa consumă mult mai puțină energie și va fi prima care va ajunge la linia de sosire - mai ales dacă încărcarea bateriei iepurii nu este prea mare ilvvv j nivel logic digital Microcontroler Atmel ATmegal Coge i și OMLR sunt procesoare de înaltă performanță concepute pentru a crea dispozitive de calcul de mare viteză (Core i este conceput pentru computere desktop, OMAP este pentru sisteme mobile) Există însă și alte computere, de fapt mult mai numeroase - așa-numitele sisteme embedded În această secțiune, îi vom cunoaște Nu este exagerat să spunem că practic orice dispozitiv electronic care valorează mai mult de USD conține un computer încorporat Televizoarele, telefoanele mobile, secretarele electronice, cuptoarele cu microunde, camerele video, aparatele video, imprimantele laser, sistemele de alarmă împotriva intrușilor, aparatele auditive, jocurile electronice și multe alte dispozitive (lista este nesfârșită) sunt controlate de un computer În acest caz, se pune accent nu pe performanța ridicată, ci pe costul redus al unui computer încorporat, ceea ce duce la un echilibru ușor diferit de avantaje și dezavantaje față de procesoarele despre care am discutat până acum Am menționat în Capitolul că ATmegal este în prezent cel mai comun microcontroler O astfel de popularitate se datorează în primul rând costului său scăzut După cum veți vedea în curând, ATmegal este un IC versatil care este foarte ușor și ieftin de conectat la alte dispozitive Structura sa fizică este prezentată în Fig După cum puteți vedea din figură, ATmegal este de obicei furnizat într-un pachet standard cu de pini (deși alte pachete sunt disponibile pentru aplicații specifice) O anumită ciudățenie a acestui cip în comparație cu cele două exemple anterioare este imediat evidentă: nu are linii de adresă și linii de date Faptul este că microcircuitul nu este proiectat pentru a fi conectat la memorie - doar la dispozitive Toată memoria (statică și flash) este conținută în procesorul însuși, eliminând nevoia de adrese separate și linii de date (Figura ) PC cu \ DOP CZ PD EZ PD C PD C PD C VCCtZ GNDC РВ □ РВ [Z PD CZ PD C PD □ RVO □ L / Z PC ZJ PC Z] RSZ □ PC ZI PC Z RCO ZI GND ZI AREF Z] AVCC ZI РВ Z] PB ZI RVZ ZI PB ZI РВ PC cu \ PD C PD C PD CZ PD C PD C VCCCZ GNDC РВ С РВ □ PD □ PD □ PD C RVO □ / ZI PC □ PC Z RSZ Z] PC □ PC □ RSO ZI GND □AREF ZJ AVCC □ RV □ RV ZI RVZ □ RV ZI РВ Orez Aspectul fizic al cipului ATted! Orez Arhitectura internă și aspectul logic al ATmegal În loc de linii de adrese și linii de date, ATmegal conține de porturi I/O digitale, linii de porturi B și D și linii de porturi C Liniile de I/O digitale sunt destinate pentru conectarea dispozitivelor I/O periferice și programul de inițializare poate seta modul de funcționare inter-linie (intrare sau ieșire) De exemplu, atunci când este utilizat într-un cuptor cu microunde, o linie digitală poate primi intrare de la un senzor deschis iar celălalt - pentru a da un semnal de ieșire pentru a porni și opri i II * I generator Înainte de a porni generatorul cu microunde, software-ul L GtecaKiI verifică dacă ușa cuptorului este închisă Dacă ușa se deschide brusc, programul ar trebui să oprească urgent alimentarea Cu toate acestea, în practică, blocarea hardware este întotdeauna utilizată În plus, cele șase linii ale portului C pot fi configurate pentru intrare/nod analogic Liniile analogice I/O pot citi nivelul tensiunii de intrare și pot seta nivelul tensiunii de ieșire Deci, în contextul exemplului anterior, unele cuptoare cu microunde au un senzor care permite aragazului să încălzească alimentele la o temperatură predeterminată Senzorul de temperatură al nodului este conectat la intrarea portului C, programul citește tensiunea senzorului și convertește temperatura utilizând funcția de conversie pentru o anumită dată Liniile rămase ale ATmegal sunt intrarea de putere (VCC), două legături „ ore de ieșiri pentru întregul set de semnale de adresă și informații, chiar dacă PCI funcționează cu adrese pe de biți și date pe de biți Ieșirile combinate de adrese și date abia dacă funcționează Când este citită în timpul primului ciclu, șoferul transferă adresa către autobuz În timpul celui de-al doilea ciclu, masterul elimină adresa și comută magistrala astfel încât slave să o poată utiliza În timpul celui de-al treilea ciclu, slave i-a dat datele solicitate Când scrieți, magistrala nu trebuie să comute, deoarece șoferul îi transmite atât adresa, cât și datele Cu toate acestea, tranzacția cu acțiuni minime durează trei cicluri Dacă dispozitivul slave nu poate răspunde în trei cicluri, atunci se intră în modul de așteptare Sunt permise transferuri nelimitate în bloc, precum și alte tipuri de cicluri de autobuz Arbitrajul magistralei PCI Pentru a utiliza magistrala PCI, dispozitivul trebuie mai întâi să o poată accesa Busul PCI este controlat de un arbitru centralizat, așa cum se arată în Fig , În cele mai multe cazuri, arbitrul de autobuz este încorporat într-unul dintre podurile de autobuz Două linii dedicate* rulează de la fiecare dispozitiv PCI la arbitru Unul dintre ele (REQ#) este folosit pentru a solicita magistrala, iar al doilea (GNT#) pentru a obține permisiunea de a accesa magistrala (Notă: REQ# reprezintă REQ în terminologia PCI ) Orez , Autobuzul PCI are un arbitru centralizat Pentru a face o cerere de acces la magistrală, dispozitivul PCI (inclusiv CPU) setează semnalul REQ# și așteaptă până când arbitrul setează semnalul GNT# Dacă arbitrul setează semnalul GNT#, atunci dispozitivul poate folosi magistrala în următorul ciclu Algoritmul care ghidează Exemple de anvelope MB Hg este definit în specificația magistralei PCI Este permis arbitrajul prioritar ciclic, precum și alte scheme de arbitraj Desigur, Arbitrul trebuie să fie corect, pentru a nu forța aranjamente individuale pentru eternitate este prevăzută pentru o singură tranzacție, deși durata acestei ^^Craction este teoretic nelimitată Dacă un dispozitiv trebuie să comite o tranzacție și niciun alt dispozitiv nu solicită autobuzul, acesta poate fi din nou pe magistrală, deși de obicei necesită inserarea unei bucle între tranzacții Cu toate acestea, în circumstanțe speciale (în absența unei dispute la un vârf), un dispozitiv poate face tranzacții consecutive ^^Trebuie să circule între ele Dacă masterul transmite foarte prost și un alt dispozitiv a emis o cerere de acces, arbitrul poate reseta semnalul pe linia GNT# Se presupune că dispozitivul Idoncse monitorizează linia GNT#, iar la resetare, dispozitivul va elibera magistrala în ciclul următor Un astfel de sistem permite transmisii foarte lungi (ceea ce este foarte rațional) în absența restricțiilor de acces la magistrală, dar în același timp răspunde rapid la solicitările NIM de la alte dispozitive ■ Bus PCI YGIbble VINA IGP acceptă un număr de MGNAL obligatorii (Tabelul ) și un număr de MGNAL opționale (Tabelul ) Pinii rămași sunt folosiți pentru alimentare, împământare și o varietate de semnale aferente În coloanele „Driver* || ^Dispozitiv sclav" specifică ce dispozitiv setează semnul |NUI într-o tranzacție normală Dacă semnalul este setat de un alt dispozitiv ^Exemplu, CLK), ambele coloane sunt lăsate necompletate Tabelul Semnale obligatorii de magistrală PCI Semnal Număr de linii Master Slave Comentariu CI K generator de ceas ( MHz sau MHz) Al) Da Da Adresă și linii de date combinate PAR Da Bit de paritate pentru adresa sau date ('/BE# Da În primul rând, o comandă către magistrală, în al doilea rând, un bitmap care indică ce octeți din cuvânt ar trebui să fie citiți (sau scrieți) l'RAME# Da Indică faptul că semnalele AD și C/BE sunt setate IRDY# DA Când este citit, înseamnă că masterul este pregătit să primească date; la scriere - că datele sunt în magistrală continuare & Tabelul (continuare) Semnal Număr de linii Master Slave Comentariu IDSEL Da Citiți spațiul de configurare DEVSEL# Da Slavul și-a recunoscut adresa și așteaptă un semnal TRDY# Da Când citiți, înseamnă că datele sunt pe liniile AD; când scrieți că dispozitivul slave este pregătit să primească date STOP# Da Slave cere să nu anuleze încet tranzacția curentă PERR# Eroare de paritate a datelor detectată SERR# Paritatea adresei sau eroarea de sistem a fost detectată REQ# Arbitraj autobuz - Solicitare acces autobuz GNT# Arbitraj pentru autobuze - Grant autobuz RST# Reporniți sistemul și toate dispozitivele Tabelul Semnale suplimentare de magistrală PCI Semnal Număr de linii Master Slave Comentariu REQ # Da Solicitare pentru o tranzacție pe de biți ACK # Da Activați tranzacția pe de biți AD Da de biți suplimentari de adresă sau date PAR Da Paritate pentru de biți suplimentari de adresă sau date C/BE# Da biți suplimentari pentru a indica ce octeți ai cuvântului să citească (sau să scrie) C-SC Da În sistemele multiprocesor, blocarea magistralei atunci când o tranzacție este efectuată de unul dintre procesoare F Exemple de anvelope ІШіи irі іy e| Și INI ÎN Gn HM" Minn N Numărul de linii Master Slave Comentariu În sistemele multiprocesor, accesarea memoriei cache a altui procesor În sistemele multiprocesor, semnalul pentru finalizarea monitorizării Cerere de întrerupere semnale de testare IEEE JTAG Semnal conectat la sursa de alimentare sau la masă ( MHz sau MHz) Ііііісрі" să ne uităm la fiecare semnal al magistralei PCI separat Să începem • semnale nGіiiiііігглpy ( de biți), apoi treceți la rândul suplimentar I M pіі i) Semnalul CLK controlează magistrala Cele mai multe dintre semnalele de intrare sunt conectate cu acesta Pe magistrala PCI, o tranzacție începe la căderea semnalului CLK, în acest sens n ( este pornit pentru o anumită perioadă de timp, dispozitivul master presupune că dispozitivul slave către care este direcționat apelul, shGii, este absent sau este defect ilvm h nivel logic digital Următorul semnal este TRDY# Sclavul său este setat pe o citire pentru a indica faptul că datele sunt pe liniile AD și pe o scriere pentru a indica că este gata să primească date ■ Următoarele trei semnale sunt folosite pentru a raporta mesajele de eroare Unul dintre ele, semnalul STOP#, este setat de către slave, ecjfl, ceva a mers prost și tranzacția curentă trebuie să fie anulată Următorul semnal, PERR#, este folosit pentru a raportați o eroare de paritate în datele din ciclul anterior Pentru citire, acest semnal este setat de dispozitivul care da, pentru scriere, de dispozitivul slave Acțiunea Required® trebuie luată de dispozitivul care primește acest semnal În cele din urmă, semnalul SERR# este utilizat pentru a raporta erorile de adresă și de sistem W Semnalele REQ# și GNT# sunt pentru arbitrajul magistralei Ele sunt instalate nu de dispozitivul care este master în acest moment, ci de T B care vrea să devină master Ultimul semnal obligatoriu, RST#, se aplică la o resetare a sistemului, care are loc fie atunci când gelul utilizatorului apasă butonul RESET, fie dacă un dispozitiv de sistem detectează o eroare fatală După setarea acestui semnal, reporniți computerul ^ Să trecem la semnale suplimentare, dintre care majoritatea sunt legate de extinderea pațp a adâncimii de biți de la la de biți Semnalele REQ # și ACK # permit masterului să ceară permisiunea de a executa o tranzacție pe de biți și ca slave să accepte tranzacția Semnalele AD, PAR și C/BE# sunt extensii ale semnalelor corespunzătoare pe de biți Următoarele trei semnale nu sunt legate de trecerea de la la de biți Sunt utilizate în sistemele multiprocesor Nu toate plăcile PCI acceptă astfel de sisteme, astfel încât aceste semnale sunt clasificate ca opționale Semnalul LOCK vă permite să blocați vârful pentru tranzacțiile concurente Următoarele două semnale sunt legate de faza de urmărire, ceea ce vă permite să păstrați cache-urile diferitelor procesoare consistente Semnalele INTr sunt necesare pentru a solicita întreruperi Placa PCI poate conține până la patru dispozitive logice, fiecare cu propria linie de cerere de întrerupere Semnalele JTAG sunt pentru procedura de testare IEEE JTAG În cele din urmă, semnalul M EN este legat fie de sursa de alimentare, fie de masă, ceea ce determină frecvența ceasului Nu ar trebui să se schimbe în timp ce sistemul rulează Tranzacții pe magistrala PCI Autobuzul PCI este de fapt foarte simplu (pentru un autobuz modern, desigur) Pentru a înțelege mai bine acest lucru, luați în considerare diagrama de timp din Fig , Aici vedem o tranzacție de citire, urmată de o buclă goală și o tranzacție de scriere, care este efectuată de același driver În timpul ciclului T, pe frontul descendent al semnalului de ceas, șoferul plasează adresa pe linia AD și comanda pe linia C/BE# Driverul setează apoi semnalul FRAME# pentru a începe tranzacția În timpul ciclului T , dispozitivul principal comută vârful, astfel încât dispozitivul slave să îl poată utiliza în timpul ciclului T De asemenea, șoferul modifică semnalul C/BE# pentru a indica ce octeți din cuvânt ar trebui să citească Ciclul autobuzului Orez , Exemple de tranzacții pe de biți pe magistrala PCI În timpul primelor trei cicluri, are loc o operație de citire, apoi un ciclu gol, iar următoarele trei cicluri, o operație de scriere În timpul ciclului T , slave afirmă semnalul DEVSEL# Semnalul hoi îi spune maestrului că sclavul este la adresă și este pe cale să răspundă Dispozitivul slave plasează, de asemenea, liniile a -a AD și emite semnalul TRDY#, care informează master VI despre această acțiune Dacă sclavul nu poate răspunde rapid, nu dezactivează DEVSEL# semnalând prezența acestui VI, dar nu afirmă TRDY# până când nu pot trimite date Această procedură introduce una sau mai multe perioade de așteptare În exemplul nostru (și adesea în practică), bucla următoare este goală Vedem că în ciclul T , același șofer inițiază procesul de untură În primul rând, pune adresa și comanda pe autobuz, ca de obicei În ciclul următor, scoate date Deoarece liniile AD sunt controlate de același dispozitiv, nu este necesar niciun ciclu de comutare În ciclul T , memoria acceptă iiiiii PCI Express Capacitățile spike-urilor PCI sunt destul de suficiente pentru majoritatea aplicațiilor moderne, dar nevoia de I/O mai rapide a devenit treptat mai complicată! arhitectura internă odată subțire a PC-ului Figura clar Este de remarcat faptul că spike-ul PCI nu mai este elementul central care reunește componentele unui PC Acest rol este acum jucat de pod Miezul problemei este că în timp apar tot mai multe dispozitive I/O care sunt prea rapide pentru magistrala PCI Overclockarea ceasului magistralei este departe de a fi cea mai bună soluție, deoarece nu face decât să agraveze problemele legate de deformarea magistralei, diafonia între conductori și capacitatea Ori de câte ori apare un dispozitiv nou care este prea rapid pentru magistrala PCI (fie că este un adaptor grafic, un hard disk, un controler de rețea etc ), dezvoltatorii Intel trebuie să creeze un alt port specializat, cu care mosi permite acestui dispozitiv să ocolească magistrala PCI Desigur, o astfel de soluție este concepută pe termen lung Un alt dezavantaj al magistralei PCI este că plăcile sunt supradimensionate Plăcile PCI standard sunt de obicei de , x , cm, în timp ce plăcile compacte sunt de , x , cm Nici o opțiune nu se potrivește în cazul laptopurilor moderne, ca să nu mai vorbim de modelele de buzunar În același timp, producătorii reduc în mod constant dimensiunea dispozitivelor lor În plus, unii producători intenționează să treacă la o nouă schemă de rezoluție a dispozitivelor în carcasele PC - și anume, plasarea procesorului și a memoriei într-un compartiment închis separat și hard conduceți în interiorul monitorului Cu plăcile PCI, această soluție nu este fezabilă Acum se propun mai multe soluții la aceste probleme, dar, cel mai probabil, câștigătoarea în competiție va fi tehnologia PCI Express, care este promovată activ de Intel În ciuda numelui, nu are aproape nimic de-a face cu magistrala PCI; În plus, nu este deloc o anvelopă Cu toate acestea, marketerii au decis să nu scape de numele „PCI” - din fericire, este pe buzele tuturor Acum, prezența acestui autobuz într-un computer a devenit un standard Să vedem ce este Arhitectura PCI Express Esența tehnologiei PCI Express este înlocuirea magistralei paralele cu varietatea sa de dispozitive master și slave cu conexiuni seriale punct la punct de mare viteză Această decizie marchează plecarea definitivă de la topologia magistralei implementată în magistralele ISA/EISA/PCI și trecerea la topologia rețelelor locale (în special rețelele Ethernet comutate) Ideea de bază este aceasta: în esență, un PC este un set de cipuri ale unui procesor, memorie și dispozitive I/O care trebuie interconectate Având în vedere această circumstanță, PCI Express joacă rolul unui comutator universal care conectează microcircuite prin canale seriale Configurația standard PCI Express este prezentată în fig , După cum puteți vedea din figură, procesorul, memoria și memoria cache sunt conectate la bridge în mod tradițional Noul element aici este comutatorul conectat la punte (uneori este construit direct în cipul de punte) Se stabilește o conexiune punct la punct între fiecare cip de dispozitiv I/O, pe de o parte, și comutator, pe de altă parte Orice astfel de conexiune constă din două legături unidirecționale, câte una în fiecare direcție între dispozitiv și comutator Canalele constau din două Orez , Aspect standard al sistemului PCI Express iii (semnal și masă), care asigură imunitate ridicată la zgomot-ikn și în timpul transmisiei de semnal de mare viteză Această arhitectură diferă de unificarea și egalitatea mai mare anterioară a tuturor dispozitivelor Principalele puncte disting arhitectura PCI Express de arhitectura I'(I) Am luat deja în considerare două dintre ele - aceasta este prezența unui comutator centralizat * yura, care a înlocuit principiul unei magistrale multi-tap și utilizarea de conexiuni înguste wi/tactile punct-la-punct în loc de o magistrală paralelă largă A treia diferență nu este așa Modelul conceptual care ♦și non-o magistrală PCI este că magistrala magistrală instruiește dispozitivele slave să citească un cuvânt sau un bloc de mai multe și shii PCI Express se bazează pe un principiu diferit, care prevede trimiterea de pachete de date de la un dispozitiv la altul Conceptul de pachet format dintr-un antet și o sarcină utilă este împrumutat din tehnologia rețelei II și antetul conține informații de control, ceea ce înseamnă că nu este nevoie de numeroase semnale de control care joacă un rol important în transmisia prin magistrala PCI Sarcina utilă conține date direct transferabile Astfel, un PC care acceptă tehnologia Tehnologia PCI Express seamănă cu o rețea miniaturală cu comutare de pachete Pe lângă cele mai importante modificări enumerate mai sus, există și altele mai puțin vizibile În special, pachetele folosesc un cod de detectare a erorilor mai fiabil decât cel PCI În plus, lungimea fizică a conexiunii dintre cip și comutator a crescut la cm, fapt pentru care a devenit mai convenabil să se schimbe poziția componentelor sistemului Deoarece un alt comutator poate fi conectat la comutatorul de bază, formând astfel o structură arborescentă, scalabilitatea sistemului este crescută În plus, dispozitivele sub PCI Express sunt conectabile la cald*, ceea ce înseamnă că pot fi îndepărtate și extrase din mers În cele din urmă, deoarece conectorii seriali sunt mult mai mici decât conectorii PCI mai vechi, nimic nu îi împiedică pe noii producători să dezvolte dispozitive și computere compacte Astfel, PCI Express se abate puternic de la principiile magistralei PCI Stiva de protocoale PCI Express Urmând modelul de rețea cu comutare de pachete, tehnologia PCI Express se bazează pe o stivă de protocoale stratificată Un protocol este un set de reguli care definesc mecanismul de interacțiune între două părți În consecință, o stivă de protocoale este un sistem ierarhic de protocoale care reglementează diverse aspecte ale interacțiunii la diferite niveluri Să luăm ca exemplu o scrisoare de afaceri Sunt sigure!' reguli privind locația și conținutul capului scrisorii, adresa expeditorului, data, forma de salut, corpul scrisorii, semnăturile etc Toate aceste condiții de afișare pot fi numite colectiv protocolul unei afaceri scrisoare În plus, există standarde privind dimensiunea și formatul plicului, amplasarea ștampilei și subtilități similare Aceste două straturi și protocoalele lor respective sunt independente unul de celălalt De exemplu, puteți schimba complet formatul scrisorii, punându-l într-un plic standard și invers Astfel de protocoale stratificate, care permit dezvoltarea modulară cu un nivel ridicat de flexibilitate, au fost utilizate pe scară largă în domeniul software-ului de rețea de câteva decenii În tehnologia PCI Express, s-a încercat să le implementeze în hardware-ul „autobuz” Stiva de protocoale PCI Express este prezentată în Fig , a Nivelul programului Nivelul tranzacției Sarcina utilă antet Stratul de legătură Număr Antet sarcină utilă CRC b Strat fizic Număr cadru Antet Sarcină utilă Cadru CRC Orez , Stiva de protocoale PCI Express (a); format pachet (b) A Să luăm în considerare nivelurile în ordine crescătoare Cel mai de jos este stratul fizic Este responsabil pentru transmiterea biților de la emițător la receptor printr-o conexiune punct la punct Fiecare astfel de conexiune constă din unul sau mai multe canale non-simplex (unidirecționale) În cel mai simplu caz, se alocă câte o pereche pentru fiecare direcție, dar este posibil să existe și , , , sau de perechi Canalele în perechi se numesc benzi Fiecare sens trebuie să aibă același număr de benzi Prima generație oferă rate de transfer de date de , GB/s pentru fiecare direcție, dar după ceva timp această cifră va ajunge probabil la GB/s Spre deosebire de magistralele ISA, EISA și PCI, tehnologia PCI Express nu oferă un generator de ceas Dispozitivele au dreptul de a începe transmisia în orice moment, și, lor, vor avea ceva de transmis Libertatea lui Gakam, pe de o parte, este nouă pentru acțiune, pe de altă parte, creează o problemă Să presupunem că ko-ncc'і'іі și o tensiune de * V, iar o tensiune de V Dacă primele câteva Hі і ni іе іyіo secvența de zero biți este greu de distins de inactiv • noi și Această problemă este rezolvată cu ajutorul așa-numitului cifru de / biți În această schemă, octet de date reale este codificat cu un caracter de biți Din de caractere posibile pe biți, le puteți alege pe cele care, datorită unui număr suficient de fronturi, fără un • ♦Jocurile muntelui asigură sincronizarea expeditorului și destinatarului de-a lungul limitelor ііninі Datorită utilizării codificării pe / biți, debitul total • Lățimea de bandă a canalului, egală cu , GB/s, se restrânge la debitul real > ік nbiost GB/s Stratul de legătură este responsabil pentru transmiterea pachetelor La acest nivel, un număr de serie și un cod de corectare a erorilor, la antetul trimis de la nivelul tranzacției se adaugă așa-numitul CRC (Cyclic Redundancy Check) Codul CRC este generat prin aplicarea unui algoritm specific antetului și sarcinii utile La primirea unui pachet, dispozitivul efectuează calcule similare cu antetul și datele și compară rezultatul cu valoarea specificată în pachet Dacă cele două acreditări se potrivesc, un pachet de validare este trimis înapoi expeditorului inițial pentru a verifica corectitudinea datelor primite În caz contrar, destinatarul nu va solicita o retransmitere Astfel, în hui sunt mult crescute de exemplu, geluri de integritate a datelor în comparație cu magistrala PCI, în care nu există rebook-uri de mijloace de control și retransmitere a datelor Pentru a evita supraîncărcarea unui receptor lent cu pachete care ies de la un expeditor rapid, este implementat un mecanism de control al fluxului Acest mgmanizm se bazează pe eliberarea de către destinatar către expeditor a unui anumit număr de permisiuni pentru transmiterea pachetelor - în funcție de cantitatea de spațiu necesară pentru stocarea acestora După ce a epuizat permisiunile acordate anterior, expeditorul trebuie să suspende transmisia și să consume noi permisiuni O astfel de schemă, comună în toate rețelele, previne pierderea datelor din cauza nepotrivirii vitezelor de trimitere • mn şi destinatarul La nivel de tranzacție, toate operațiunile cu magistrala sunt efectuate De exemplu, pentru a citi un cuvânt din memorie, trebuie efectuate două tranzacții, dintre care una este inițiată de procesorul sau canalul DMA care solicită date, cealaltă de obiectul de valoare (furnizorul de date) Cu toate acestea, citirea și scrierea nu sunt singurele migrări care sunt efectuate la nivel de tranzacție Acest strat, în special, extinde capacitățile de transfer de pachete furnizate de stratul de legătură Fiecare bandă la nivel de canal este subdivizată în mai multe (până la opt) canale virtuale, fiecare transportând date de unul sau altul La nivel de tranzacție, pachetele sunt marcate în funcție de clasa de trafic i, care definește un număr de proprietăți precum „prioritate mare”, „prioritate scăzută”, „fără urmărire”, „livrare în afara secvenței permisă” și i e Comutatorul se bazează pe informații despre token, printre altele, pentru a determina ordinea în care sunt procesate pachetele Orice tranzacție are loc în unul dintre cele patru spații de adresă: + spațiu de memorie (când se efectuează operații standard de citire și scriere); + spațiu I/O (pentru adresarea registrelor dispozitivului); + spațiu de configurare (pentru inițializarea sistemului etc ); + spațiu pentru mesaje (pentru trimiterea de semnale, întreruperi etc ) Memoria și spațiile I/O sunt similare cu cele tradiționale care sunt implementate în sistemele moderne În spațiul de configurare, este posibilă implementarea diferitelor tipuri de mecanisme, de exemplu, configurația automată (APC) Spațiul de mesaje își asumă astăzi funcțiile numeroaselor semnale de control Este imposibil să faci fără acest spațiu, deoarece în PCI Express nu există linii de control prevăzute în magistrala PCI Stratul software acționează ca un intermediar între PCI Express și sistemul de operare Printre altele, oferă un mod de emulare a magistralei PCI care vă permite să instalați sisteme de operare vechi în computerele echipate cu PCI Express fără nicio modificare Desigur, atunci când se lucrează în astfel de condiții, implementarea tuturor caracteristicilor PCI Express nu este fezabilă, dar compatibilitatea inversă este o măsură necesară - cel puțin până când toate sistemele de operare acceptă pe deplin PCI Express Experiența arată că acest proces va dura mult timp Fluxul de informații tipic pentru PCI Express este prezentat în fig b Comanda care ajunge la nivelul programului este transmisă la nivelul tranzacției, de unde se formează antetul și sarcina utilă Apoi aceste componente sunt trimise la stratul de legătură, unde antetul pachetului * este setat la un număr de secvență, iar coada este setată la un cod CRC Apoi, pachetul extins este trecut la stratul fizic, unde parametrii de cadru sunt adăugați la ambele capete, iar pachetul fizic rezultat este transmis de la expeditor la destinatar Pe partea destinatarului, are loc procesul invers - antetul și coada cadrului la nivel de legătură sunt eliminate, iar rezultatul este transferat la nivelul tranzacției Conceptul de atașare a datelor suplimentare la fiecare strat ulterior al stivei de protocoale a fost folosit în rețelele de calculatoare de foarte mult timp și cu succes Principala diferență dintre tehnologiile de rețea și PCI Express este că, în primul caz, codul care operează la diferite niveluri ale stivei este aproape întotdeauna software și este controlat de sistemul de operare În PCI Express, pe de altă parte, operațiunile la toate nivelurile sunt implementate în hardware Structura PCI Express este destul de complexă Descrierea sa detaliată este disponibilă în [Mayhewand Krishnan, ; Solari și Congdon, ] În plus, tehnologia continuă să evolueze - în , a fost lansată versiunea PCIe Acceptă MB/s pe canal și până la de canale pentru o lățime de bandă totală de până la GB/s În , a fost lansată versiunea PCIe , care a schimbat codificarea de la / -bit la / -bit, cu capacitatea de a efectua până la miliarde de tranzacții pe secundă - de două ori mai mult decât PCIe Autobuz USB În timp ce PCI și PCI Express sunt foarte potrivite pentru conectarea perifericelor de mare viteză, utilizarea interfeței PCI pentru dispozitive I/O cu viteză redusă (cum ar fi șoarecii și tastaturile) a fost ineficientă Inițial, fiecare dispozitiv I / O standard mi / nnya 'ios cu computerul într-un mod special, în timp ce sloturile ISA și PCI gratuite au fost folosite pentru a adăuga altele noi și iroyc gv Din păcate, așa ♦ N'MP are unele dezavantaje De exemplu, fiecare dispozitiv I/O nou este adesea echipat cu propriul card ISA sau PCI În același timp, utilizatorul trebuie să seteze el însuși ngrk/po'iatsli și jumperii pe placă și să se asigure că placa configurată nu se nіpіf/іktuet cu alte plăci Apoi utilizatorul trebuie să deschidă sistemul N'Ny\, să introducă cu atenție placa, să închidă unitatea de sistem și să pornească computerul Pentru mulți, acest proces este foarte complicat și duce adesea la erori În afară de asta, numărul de sloturi ISA și PCI este foarte mic (de obicei două sau trei) Plăcile configurate automat (PPR) elimină nevoia de a seta comutatorul și urii, dar utilizatorul trebuie totuși să deschidă computerul și să introducă placa În plus, numărul de sloturi de autobuz este limitat În , șapte companii (Compaq, DEC, IBM, Intel, Mhhisoft, NEC și Northern Telecom) s-au reunit pentru a dezvolta un autobuz care era cel puțin potrivit pentru conectarea dispozitivelor cu viteză redusă Apoi i s-au alăturat sute de alte companii Rezultatul muncii lor a fost magistrala UNII (U nivcrsal Serial Bus - Universal Serial Bus), care este încă utilizat pe scară largă în computerele personale Mai multe detalii • Legenda USB este dată în literatură [Anderson, ; Apăsați ] Câteva dintre cerințele care au stat inițial la baza proiectului: ♦ utilizatorii nu trebuie să instaleze întrerupătoare și jumperi pe plăci și dispozitive; і utilizatorii nu trebuie să deschidă computerul pentru a instala noi dispozitive I/O; ♦ să existe un singur tip de cablu adecvat pentru conectarea tuturor dispozitivelor; > Dispozitivele I/O trebuie alimentate prin cablu; ar trebui să fie posibil să se conecteze până la de dispozitive la un computer; і sistemul trebuie să suporte dispozitive în timp real (ex dispozitive de sunet, telefon); + ar trebui să fie posibilă instalarea dispozitivelor în timp ce computerul rulează; + instalarea unui dispozitiv nou nu ar trebui să necesite repornirea computerului; + Producția unei noi magistrale și a dispozitivelor I/O pentru aceasta nu ar trebui să fie costisitoare Autobuzul USB îndeplinește toate aceste condiții Este conceput pentru dispozitive cu viteză redusă (tastaturi, șoareci, camere, scanere, digitale iesit telefoane si g e) Debitul total al primei versiuni a spike (USB ) a fost de , Mbps Versiunea rulează la Mbps, cipul este suficient pentru imprimante, camere digitale și multe alte dispozitive Versiunea acceptă dispozitive de până la Mbps, suficient pentru a suporta unități externe, camere web de înaltă definiție și interfețe de rețea Versiunea recent lansată de USB a crescut viteza la Gb/s; doar timpul va spune ce aplicații noi și solicitante va da naștere această interfață ultra-rapidă Busul USB constă dintr-un hub rădăcină care se conectează la conectorul magistralei principale (vezi Figura ) Acest hub rădăcină (denumit adesea hub rădăcină) conține conectori pentru cabluri care pot fi conectate la dispozitive I/O sau hub-uri suplimentare pentru a crește numărul de conectori Astfel, topologia magistralei USB este un arbore înrădăcinat la hub-ul rădăcină care se află în interiorul computerului Conectorii de cablu de pe partea dispozitivului sunt diferiți de conectorii de pe partea de hub, astfel încât utilizatorul să nu conecteze accidental cablul cu cealaltă parte Cablul este format din patru fire: două dintre ele sunt pentru transmiterea datelor, unul pentru alimentare (+ V) și unul pentru masă Sistemul transmite cu o schimbare de tensiune și fără schimbare de tensiune, astfel încât o secvență lungă de biți zero generează un flux de impulsuri regulate Când este conectat un nou dispozitiv I/O, hub-ul rădăcină detectează acest fapt și închide sistemul de operare Sistemul de operare interogează apoi noul dispozitiv pentru a afla ce este și câtă lățime de bandă de magistrală necesită Dacă sistemul de operare decide că există suficientă lățime de bandă pentru acest dispozitiv, îi atribuie o adresă unică ( - ) și încarcă această adresă și alte informații în registrele de configurare din cadrul dispozitivului Astfel, noi dispozitive pot fi conectate din mers, în timp ce utilizatorul trebuie să instaleze noi carduri ISA sau PCI Plăcile neinițializate încep la adresa , astfel încât să poată fi accesate Multe dispozitive au hub-uri de rețea încorporate pentru dispozitive suplimentare De exemplu, un monitor poate conține două hub-uri pentru difuzoarele din dreapta și din stânga Autobuzul USB este o serie de canale între hub-ul rădăcină și dispozitivele I/O Fiecare dispozitiv își poate împărți canalul în până la sub-canale pentru diferite tipuri de date (de exemplu, audio și video) În fiecare canal sau subcanal, datele se mută de la hub-ul rădăcină la dispozitiv și invers Nu există schimb de informații între cele două dispozitive I/O Exact la fiecare milisecundă (± , ms), hub-ul rădăcină trimite un nou cadru pentru a sincroniza toate dispozitivele în timp Cadrul este format din pachete, primul fiind transmis de la hub la dispozitiv Următoarele pachete ale cadrului pot fi transmise în aceeași direcție, sau în direcția opusă (de la dispozitiv la hub) Pe fig arată patru cadre consecutive unu ■OF Timp, ms am crezut miez I ID de date Nici un dispozitiv Orez , Hub-ul rădăcină al magistralei iZV transmite cadre la fiecare milisecundă Cadrele și nu fac nimic, așa că conțin doar un singur pachet SOF (Start of Frame) Acest pachet nu este trimis întotdeauna către niciun dispozitiv Cadrul este o solicitare ordonată (de exemplu, send-i ii către scaner și o solicitare de a trimite biți din imaginea scanată) Cadrul constă în trimiterea de date către un dispozitiv (de exemplu, o imprimantă) III USB acceptă tipuri de cadre: cadre de control, nuclee izocrone, cadre de transfer de date în bloc și cadre de întrerupere Cadrele de control sunt folosite pentru a configura dispozitivele, pentru a trimite comenzi către dispozitive și către noi și pentru a interoga starea acestora Cadrele izocrone sunt destinate dispozitivelor în timp real (microfoane, difuzoare și telefoane) care trebuie să primească și să trimită date pe intervale de timp egale Întârzierile sunt bine prezise, dar în cazul unei erori, astfel de dispozitive vor retransmite Cadrele de tipul următor sunt utilizate pentru transferuri de volum mare de la și către dispozitive (de exemplu imprimante) ale cerințelor specifice dispozitivelor în timp real În cele din urmă, sunt necesare cadre de acest din urmă tip, deoarece magistrala USB nu acceptă întreruperi De exemplu, pentru a nu declanșa o întrerupere de fiecare dată când este apăsată o tastă, sistemul de operare poate interoga tasta la fiecare de milisecunde și poate „colecta” toate datele brute de apăsare a tastei Un cadru este format din unul sau mai multe pachete Pachetele pot trimite -i a în ambele direcții Există patru tipuri de pachete: jetoane, pachete de date, pachete de strângere de mână și pachete speciale Tokenurile sunt transmise de la hub la dispozitiv și sunt destinate să controleze sistemul Pachetele SOF, IN și OUT din fig - markere Pachetul SOF (Start of Frame) este primul din orice cadru, identifică începutul cadrului Dacă nu este necesară nicio acțiune, pachetul SOF este singurul din cadru Pachetul IN este o solicitare Acest pachet necesită ca dispozitivul să furnizeze anumite date Câmpurile din pachetul IN conțin informații despre ce capal este solicitat, iar din aceste informații dispozitivul determină ce date să emită (dacă manipulează mai multe fluxuri de date) ur* / Pachetul OUI anunță că va urma transferul de date pentru dispozitiv Ultimul tip de token, SETUP (neprezentat în figură), este utilizat în configurare Pe lângă marcatori, există alte trei tipuri de pachete Acestea sunt pachete de date (sunt folosite pentru a transfera de octeți de informații în ambele direcții), pachete de confirmare și pachete speciale Formatul pachetului de date (DATA) este prezentat în fig , Acesta constă dintr-un câmp de sincronizare pe biți, un identificator de tip de pachet (PID) de biți, o sarcină utilă și un cod CRC de biți pentru detectarea erorilor Există trei tipuri de pachete de confirmare: ACK (pachetul de date anterior primit corect), NAC (eroare CRC găsită) și STAI A (dispozitiv ocupat, vă rugăm să așteptați) Acum să ne uităm la Fig , Hub-ul rădăcină trebuie să trimită un cadru la fiecare milisecundă, chiar dacă nu se întâmplă nimic Cadrele și conțin un singur pachet SOF, ceea ce indică faptul că nu se întâmplă nimic Cadrul este sondaj, deci începe cu pachetele SOF și IN de la computer la dispozitivul I/O, urmate de un pachet de DATE de la dispozitiv la computer Pachetul ACK spune dispozitivului că datele au fost primite fără eroare În cazul unei erori, dispozitivul primește un pachet NACK, după care datele sunt retransmise (rețineți că datele izocrone nu sunt retransmise) Cadrul este similar ca structură cu cadrul , dar fluxul de date este de la computer la dispozitiv După ce standardul USB a fost aprobat în sfârșit în , dezvoltatorii au început să creeze următoarea versiune de mare viteză a USB, numită USB Acest standard este în multe privințe similar cu USB și este compatibil cu acesta, totuși, la cele două viteze anterioare se adaugă unul nou - Mbps Toate celelalte modificări, inclusiv implementarea unei noi interfețe între hub-ul rădăcină și controler, nu sunt atât de semnificative Standardul USB a furnizat două interfețe UHCI și ONSI Interfața UHCI (Universal Host Controller Interface - o interfață universală de controler gazdă) a fost dezvoltată de Intel, transferând majoritatea grijilor către programatori (a se citi - la Microsoft) Programatorii le-au întors favoarea și au lansat interfața ONSI (Open llost Controller Interface - o interfață deschisă de controler gazdă), punând munca principală pe dezvoltatorii de hardware (a se citi - Intel) În timpul dezvoltării standardului USB , părțile au ajuns la o soluție reciproc acceptabilă prin lansarea unei noi interfețe numită ENCI (Enhanced Host Controller Interface - o interfață îmbunătățită a controlerului gazdă) Deoarece magistrala USB transferă acum date la Mbps, aceasta devine un concurent serios pentru magistrala serială IEEE (FireWire) care operează la Mbps sau Mbps Deoarece aproape toate sistemele moderne bazate pe Intel sunt echipate cu USB sau USB (vezi mai jos), standardul va deveni în curând un lucru al trecutului, iar motivul principal al dispariției sale nu va fi învechirea, ci lupta pentru influență USB este un produs al industriei computerelor, iar standardul își are originea în lumea electronicelor de larg consum Când vine vorba de conectarea unei camere la un computer, fiecare parte vrea să-și folosească propria interfață Se pare că „calculatoarele” au câștigat această luptă La opt ani de la lansarea USB , a fost anunțat standardul de interfață USB USB acceptă o lățime de bandă uimitoare i I bi/s, deși viteza maximă este probabil să fie atinsă numai cu cabluri pro(|aproape avansate) Dispozitivele USB sunt identice cu dispozitivele USB anterioare și implementează pe deplin standardul USB Prin urmare, atunci când sunt conectate la un Conector USB , un dispozitiv • USB va funcționa normal Interfețe I Un sistem informatic de dimensiuni mici sau mijlocii constă dintr-un procesor micro-meme, cipuri de memorie și mai multe dispozitive I/O Toate cipurile pi sunt conectate printr-o magistrală Uneori, toate aceste dispozitive sunt integrate într-un sistem cu un singur cip, ca în cazul TI OMAP Le-am luat deja în considerare, unități centrale de procesare și autobuze Acum este timpul să explorați interfețele I/O Prin aceste microcircuite computerul face schimb de informații cu dispozitive externe G Interfețe I/O II În prezent, există multe interfețe de intrare-pynode diferite și interfețe noi apar în mod constant Cele mai comune sunt UART-urile, USART-urile, controlerele CRT, disc fonrollsry și Ryu UART (Transmițător receptor universal asincron - (nici un emițător-receptor asincron real) este o interfață I/O care poate citi un octet din magistrala de date și poate transfera acel octet bit cu bit și linia de transfer serial către sau de la terminal Viteza ribogiei microcircuitelor UART este diferită: de la la bps; lățimea caracterelor de la k biți; , , sau biți de oprire; cu paritate pară sau impară, cioturi fără ea - totul este controlat de software USART (Universal Synchronous Aivnchronous Receiver Transmitter - emițător-receptor universal sincron-asincron) poate efectua transmisie sincronă folosind o serie de protocoale și, de asemenea, acceptă toate funcțiile cipului UART Deoarece interfața UART nu mai joacă un rol vizibil în modemurile telefonice timpurii, vom considera interfața RIO paralelă ca un exemplu de cip I/O interfețe PIO Un bun exemplu de interfață PYU (Intrare/Ieșire paralelă - intrare-ieșire paralelă) este cipul Intel A (Fig ) Conține > pini I/O și poate interfața cu orice dispozitiv digital (de exemplu, tastaturi, comutatoare, indicatoare, imprimante) Software-ul CPU poate scrie sau pe orice linie sau poate citi starea de intrare a oricărei linii, oferind o mare flexibilitate Un mic sistem bazat pe procesor care utilizează interfața PIO poate controla o mare varietate de dispozitive fizice - roboți, tonuri de gri, microscoape electronice Cel mai adesea interfețele Ryu întâlnesc sisteme gen, dar încorporate CS A -A WR RD Reinstalare D -D Orez , Cip A Configurația interfeței RIO este definită de un registru de biți care specifică dacă trei porturi independente de biți trebuie utilizate pentru intrarea digitală ( ) sau ieșirea digitală ( ) Scrierea valorii adecvate în registrul de configurare permite combinarea arbitrară de I/O pe cele trei porturi Fiecare port are asociat un registru de biți Pentru a configura linii pe port, CPU scrie un număr de biți în registrul corespunzător, iar acel număr de biți apare pe liniile de ieșire și rămâne acolo până când registrul este suprascris Pentru a utiliza un port pentru intrare, procesorul citește pur și simplu registrul corespunzător De asemenea, este posibil să se construiască interfețe RJ mai complexe De exemplu, un mod popular implică strângere de mână cu dispozitive externe De exemplu, pentru a trimite date către un dispozitiv, A ar putea trimite date la un port de ieșire și poate aștepta până când dispozitivul semnalează că datele au fost primite și mai multe pot fi trimise Microcircuitul include circuitele logice necesare pentru fixarea unor astfel de semnale și transmiterea lor către procesorul central Din schema funcțională a RJ din fig vedem că în plus față de de pini pentru trei porturi, cipul A conține opt linii conectate direct la magistrala de date, o linie de selecție a elementelor de memorie, linii de citire și scriere, două linii de adresă și o linie pentru resetarea cipului Două linii de adresă vă permit să selectați unul dintre cele patru registre interne, dintre care trei corespund portului A, B și C, iar al patrulea registru este registrul de configurare De obicei, cele două linii de adresă sunt conectate la cei doi biți cei mai puțin semnificativi ai magistralei de adrese Linia de probă vă permite să construiți din interfețe RJ pe de biți interfețe cu o adâncime de biți mai mare, cu adăugarea de linii de adresă suplimentare și folosindu-le pentru a selecta interfața dorită prin setarea liniei de eșantionare a cipului Decodificarea adresei Până acum, nu ne-am oprit în detaliu asupra modului în care are loc alegerea unui cip de memorie sau a unui dispozitiv I/O Luați în considerare un computer încorporat simplu pe biți, constând dintr-o unitate centrală de procesare, o EPROM de K x octeți pentru stocarea programului, o memorie RAM de K x octeți pentru stocarea datelor și o interfață RIO Un astfel de sistem mic poate fi construit într-o jucărie ieftină sau într-un dispozitiv simplu După ce produsul intră în producție de masă, EEPROM-ul este înlocuit cu un ROM convențional Interfața PIO poate fi eșantionată într-unul din două moduri: cioturi de dispozitiv I/O sau ca parte a memoriei Dacă vom folosi RIO ca dispozitiv I/O, atunci trebuie să îl accesăm pe linia de magistrală corespunzătoare, ceea ce înseamnă că apelul ciotului este către dispozitivul I/O, nu către memorie O altă abordare se numește I/O mapat cu memorie Acest cip neglijent necesită octeți de memorie pentru a fi alocați celor trei porturi și registrului lringlgpia Alegerea noastră este oarecum arbitrară Luați în considerare I/O • maparea la memorie, deoarece această abordare ilustrează clar câteva probleme interesante de împerechere Memoria EPROM necesită KB de spațiu de adrese, RAM - de asemenea J KB t, Ryu - octeți Deoarece în exemplul nostru spațiul de adrese • Dacă conține K adrese, trebuie să alegem unde să plasăm cele trei proprietăți indicate Una dintre opțiunile posibile este prezentată în Fig , EPROM ocupă adrese de până la K, RAM - de la K la K, RYU - octeți mari ai adresei pro- • i rnіk gva, de la adresele la Din punctul de vedere al programatorului, nu contează, ink k* se adresează exact de folosit, dar pentru împerechere este de mare importanță Dacă ar fi să accesăm RIO prin spațiul I/O, am avea nevoie de adrese de memorie (dar am avea nevoie de patru adrese de memorie) • reguli de intrare-ieșire) EPROM de la adresa O RAM de la adresa H PIO de la adresa FFFCH eu Despre K K K K K K K K K K K K K K K K Orez , Locația EPROM, RAM și PIO într-un spațiu de K adrese Cu această alocare de adresă, EPROM-ul trebuie accesat utilizând adresa de memorie | -bit (în binar) În alte timpuri, orice adresă cu cei mai semnificativi cinci biți egali cu intră în pool-ul de memorie de până la K, adică în EPROM Astfel, semnalul de selectare EPROM poate fi conectat la un comparator de biți, care va avea întotdeauna una dintre intrările sale conectată la Același rezultat poate fi obținut mai eficient prin utilizarea unei porți SAU cu cinci intrări conectate la liniile de adresă de la Ai la Li Semnalul de ieșire poate fi dacă și numai dacă toate cele cinci iiiiii sunt În acest caz, semnalul CS este setat Această metodă de adresare este prezentată în Fig , a\ se numește decodare completă a adresei „Același principiu poate fi aplicat RAM Cu toate acestea, RAM trebuie să răspundă la adrese binare precum lOOOOxrxxrjtxxxxx, deci este nevoie de un invertor suplimentar (este prezentat în diagramă) Decodificarea adresei Ryu este oarecum mai complicată, deoarece este selectată folosind adrese precum Ixx () una dintre variantele posibile ale circuitului, care setează numai semnalul CS și în primul caz, dacă pe magistrala de adrese apare o adresă de acest tip, este afișată în Autobuz de adrese — — — — — — — - b Orez , Decodarea adresei complete (a); decodificarea parțială a adresei (b) figura Utilizează două porți NAND cu opt intrări care sunt conectate la o poartă SAU Dacă un computer constă doar dintr-un CPU, două cipuri de memorie și un PIO, decodarea adreselor este mult simplificată Faptul este că pentru toate adresele EPROM (și numai pentru EPROM) cel mai semnificativ bit al A este întotdeauna Sunt sigur că putem conecta pur și simplu semnalul CS la linia A(G(, așa cum se arată în Fig , ) Acum decizia de a aloca RAM de la adresa H nu pare atât de ușoară Rețineți că adrese precum ІОхххххххххххх sunt în RAM, deci doi biți sunt suficienți pentru codificare În mod similar, orice adresă care începe cu este o adresă PY Acum, logica completă de decodare constă din ambele invertoare Logica ilustrată în fig b, se numește decodare parțială a adreselor, deoarece în acest caz nu sunt folosite adrese complete Cu această decodare, citirea din adresele și De fapt, orice adresă din jumătatea inferioară a spațiului de adrese înseamnă o EPROM mai mare Deoarece nu sunt utilizate adrese suplimentare, acesta nu este un lucru groaznic, dar atunci când proiectați un computer care se așteaptă să se extindă în viitor (în cazul jucăriilor, acest lucru este puțin probabil), ar trebui evitată decodarea parțială, deoarece limitează semnificativ spatiu de adresare De asemenea, puteți utiliza o altă tehnologie de decodare a adreselor - folosind un decodor (vezi Figura ) Asociând trei intrări cu trei linii de adresă nivelul microarhitecturii Semnale de control al memoriei (rd, wr, fetch) Decodor cu intrari si iesiri MAR MDR OMBR MPC PC SP CPP TOS OPC Anvelopa B MSB Memorie de control x biţi ■ pentru stocarea firmware-ului MIR JMPC Adr J ALU ( : m in JAMN/JAMZ F ALU f cu m th Autobuzul C N Z Flip-flop de bit Semnale de control Schema de schimburi H =TOS H = vârful stivei Ікз MDR \u d TOS \u d MDR -H; wr; goto Mâini Scădere; împingând rezultatul în vârful stivei EndiMAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei Sfârşit? H = TOS H = partea de sus a stivei YniіZ MDR = TOS = MDR AND H; wr; mergeți la Mâini Operațiunea ȘI; împingând rezultatul în vârful stivei №ГІ MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei lor? H = TOS H = partea de sus a stivei Ior MDR = TOS = MDR SAU H; wr; dus la operațiunea Mâini OR; împingând rezultatul în vârful stivei dupl MAR = SP = SP + Creșteți SP cu și copiați rezultatul în registrul MAR (Iup MDR = TOS; wr; mergeți la Mâini Împingeți cuvântul nou în stivă popi MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei po|) Programul așteaptă în timp ce noua valoare a registrului TOS este citită din memorie pop TOS = MDR; goto Mâini Copiați cuvântul nou în registrul TOS Nwapl MAR = SP = SP - ; rd Setați registrul MAR la SP - ; citește al doilea cuvânt din stivă nwap MAR = SP Setați registrul MAR la cuvântul de sus al stivei mwap H=MDR; wr Stochează valoarea TOS în registrul H; împingând al doilea cuvânt în vârful stivei Nwap MDR = TOS Copiați valoarea TOS veche în registrul MDR Nwap MAR = SP - ; wr Setați registrul MAR la SP- ; împingând al doilea cuvânt pe stivă Nwap TOS=H; mergeți la actualizarea Mâini TOS bipushl SP = MAR = SP + MBR = octet care trebuie împins pe stivă continuare & wv i>"■■■ ■" /roven» microarhitectură Tabelul (continuare) Comentariu de operații de microcomandă bipush PC - PC + ; aducă Mărește PC-ul cu ; apel cod după operație bipush MDR=TOS=MBR; wr; goto Mâini Adăugați un bit suplimentar la octet și împingeți valoarea în stiva W iloadl H = LV MBR conține indice; copiați valoarea LV în H J iload MAR=MBRU+H; rd MAR = adresa variabilei locale care urmează să fie împinsă în stiva J ioacist MAR = SP = SP + Registrul SP indică noul top al stivei; pregătirea pentru înregistrarea J iload PC=PC+ ; aduce; wr Creșteți valoarea PC cu ; codul de apel al următoarei operații; stiva intrarea de sus iload TOS = MDR; du-te la Mâini Update TOS i istorel H = LV MBR conține indice; copiați valoarea LV în N istore MAR = MBRU + H MAR = adresa variabilei locale pentru a stoca cuvântul din stivă istore MDR=TOS; wr Copiați valoarea TOS în registrul MDR; introducerea de cuvinte istore SP=MAR=SP- ; rd Citiți din stivă al doilea cuvânt de sus store PC=PC+ ; aducă Mărește PC-ul cu ; apelați următorul cod operațional store TOS=MDR; mergeți la actualizarea Mâini TOS widel PC = PC + ; fetch Apelați byte-ul operandului sau codul următoarei operații wide goto(MBR SAU x ) Salt la nivel încrucișat la adrese mai înalte wide ialoadl PC = PC + ; fetch MBR conține primul octet al indexului; apel al doilea octet wide iload H = MBRU " H = primul octet index deplasat la stânga cu biți wide iload H=MBRU SAU H H = index variabil local pe biți wide iload MAR = LV + H; rd; goto iload MAR = adresa variabilei locale de împins în stivă wideistorel PC = PC + ; fetch MBR conține primul octet al indexului; apel al doilea octet Exemplu de implementare a microarhitecturii SOI Comentariu operațiuni Wlih' IMoi' u' este necesar doar pentru a adăuga H la MBRU în microinstrucțiunea iload Într-un design cu doi spini, nu există nicio modalitate de a adăuga doi |nh isteri arbitrari, așa că unul dintre ei trebuie mai întâi copiat în registrul H Într-o arhitectură cu magistrale, putem salva un ciclu, așa cum se arată în Tabelul Am adăugat bucla principală la comanda ILOAD, dar lungimea căii nu a crescut sau a scăzut Cu toate acestea, magistrala suplimentară reduce timpul total de execuție a instrucțiunii de la șase cicluri la cinci Acum cunoaștem a doua posibilitate de a termina lungimea căii: Trecerea de la arhitectura cu magistrale la magistrale Tabelul Firmware pentru executarea comenzii ILOAD într-o arhitectură cu magistrale Comentariu de operații de microcomandă Iload MAR = MBRU + LV; rd MAR = adresa variabilei locale care urmează să fie împinsă în stivă Iload MAR = SP = SP + Iload PC = PC + ; aduce; wr Mărește PC-ul cu ; apelarea următorului cod operațional; scriind partea de sus a stivei Iload TOS = MDR Update TOS lload PC=PC+ ; aduce; goto(MBR) MBR-ul conține deja opcode; numim octetul index Bloc de preluare a comenzii Ambele posibilități descrise sunt destul de aplicabile, dar este necesar ceva mai radical pentru a obține un efect semnificativ Să ne întoarcem puțin și să ne uităm la ingredientele obișnuite ale oricărei comenzi: preluarea și decodarea câmpurilor* Rețineți că următoarele operații pot avea loc în fiecare comandă + Valoarea PC este trecută prin ALU și incrementată cu ; + RS este folosit pentru a apela următorul octet din fluxul de comandă; + operanzii sunt cititi din memorie; + operanzii sunt scrieți în memorie; + ALU efectuează calculul și rezultatele sunt stocate în memorie Dacă instrucțiunea conține câmpuri suplimentare (pentru operanzi), fiecare câmp trebuie apelat în mod explicit, câte un octet Câmpul poate fi utilizat numai după ce acești octeți au fost concatenați La preluarea și reasamblarea unui câmp, ALU trebuie să mărească PC-ul cu unul pentru fiecare octet și apoi să concateneze indexul sau offset-ul rezultat Atunci când, pe lângă realizarea lucrării principale a unei instrucțiuni, este necesar să apelați și să combinați câmpurile acestei instrucțiuni, ALU este utilizat în aproape fiecare ciclu Pentru a combina bucla principală cu unele microinstrucțiuni, trebuie să eliberați ALU de unele dintre aceste sarcini Un al doilea ALU poate fi introdus pentru aceasta, deși un ALU complet funcțional nu este necesar în majoritatea cazurilor Rețineți că ALU este adesea folosit pentru a copia o valoare dintr-un registru în altul Aceste bucle pot fi eliminate prin introducerea de căi de date suplimentare care nu trec prin ALU Ar fi util, de exemplu, să creați o cale de la TOS la MDR sau de la MDR la TOS, deoarece cuvântul de sus al stivei este adesea copiat dintr-un registru în altul În microarhitectura Mis- , cea mai mare parte a încărcăturii poate fi eliminată din ALU dacă este creat un bloc independent pentru a apela și procesa comenzi Această unitate, numită Instruction Fetch Unit (IFU), poate incrementa PC-ul cu unul independent de ALU și poate prelua octeți din fluxul de octeți înainte de a fi necesari IFU conține un circuit de incrementare care este mult mai simplu în design decât un adunator complet Să dezvoltăm această idee Instrucțiunea fetch id poate, de asemenea, combina șiruri fetch de și biți, astfel încât acestea să poată fi utilizate de îndată ce sunt necesare Acest •inFiio se poate face în cel puţin două moduri: ♦ Inok IFU poate interpreta fiecare cod operațional, poate determina câte câmpuri suplimentare să apeleze și le poate asambla într-un registru pentru a fi utilizat de codul operațional principal ♦ Ceasul IFU poate furniza continuu următoarele bucăți de date de sau biți, indiferent dacă are sens sau nu Unitatea de operare principală poate solicita apoi orice date de care are nevoie O implementare rudimentară a celei de-a doua metode este prezentată în fig În loc de іі/ііініo MBR pe biți, există două MBR-uri: MBR pe biți și MBR pe biți IFU ține evidența celui mai recent octet în octeți care au intrat în unitatea de operare principală În plus, mp transferă următorul octet în registrul MBR, ca și în arhitectura Mic- , doar în cazul opus determină automat când se citește valoarea registrului, acum următorul octet și îl încarcă imediat în registrul MBR Ca și în microarhitectura Mis- , are două interfețe cu magistrala B: MBR și MBR U Primul primește o extensie de semn la de biți, al doilea este umplut cu zerouri MBR Înregistrare în registrul RS Orez Blocul de preluare a comenzii în microarhitectura Mіs- Registrul MBR funcționează exact la fel, dar conține următorii octeți ()n are două interfețe cu magistrala B: MBR și MBR U, prima dintre acestea fiind extinsă cu semn, iar a doua este zero-padded la de biți Blocul de instrucțiuni de preluare este responsabil pentru preluarea fluxului de octeți Pentru a face acest lucru, folosește portul de memorie standard de octeți, apelând cuvintele trans de octeți și încărcând următorii octeți în registrul de deplasare, care le scoate idiom sau doi la un moment dat, în ordinea în care sunt preluați din memorie Sarcina registrului de deplasare este de a stoca secvența de octeți de intrare pentru încărcare în registrele MBR și MBR MBR conține întotdeauna cel mai semnificativ octet al registrului de deplasare, iar MBR octeți înalți (cel mai mare este octetul din stânga), care formează un număr întreg de rânduri (vezi Fig , b) Doi octeți din registrul MBR ar putea și derivate din cuvinte diferite de memorie deoarece comenzile IJVM nu sunt legate în niciun fel de limitele cuvintelor Ori de câte ori este citit registrul MBR , valoarea registrului de deplasare este deplasată la dreapta cu octet Când MBR este citit, valoarea registrului de deplasare este deplasată la dreapta cu octeți Apoi registrele MBR și MNU sunt încărcate cu octetul cel mai semnificativ și, respectiv, cu perechea de octeți cei mai semnificativi Dacă în acest moment există suficient spațiu dm și un cuvânt întreg rămas în registrul de deplasare, unitatea de preluare a instrucțiunii începe un ciclu de acces la memorie pentru a citi cuvântul următor Se presupune că atunci când citiți oricare dintre șirurile rsg MBR, acesta este reumplut până la începutul următorului ciclu, astfel încât noua valoare poate fi citită deja în ciclurile următoare Blocul de preluare a instrucțiunilor poate fi modelat ca o mașină cu stări finite (FSM), așa cum se arată în Fig Orice automat finit este caracterizat de stări (acestea sunt cercuri din figură) și tranziții (acestea sunt arce de la o stare la alta) Fiecare stare este una dintre situațiile posibile în care se poate afla mașina de stări Această mașină de stări are șapte stări, care corespund celor șapte stări ale registrului de deplasare prezentat în Fig Aceste șapte stări corespund! numărul de octeți care se află în prezent în registru (de la la inclusiv) Tranziții MBR : Apare când MBR este citit MBR : Apare la citirea MBR Apel de cuvânt: apare atunci când un cuvânt este citit din memorie și octeți sunt plasați în registrul de deplasare Orez Mașină de stări pentru implementarea blocului de preluare a instrucțiunilor Fiecare arc reprezintă un posibil eveniment Există trei evenimente diferite posibile în mașina noastră cu stări finite Primul este de a citi un octet din registrul MBR Activează registrul de deplasare, octetul cel mai din dreapta din acesta dispare și se face o tranziție la o altă stare (mai puțin de ) Al doilea eveniment citește octeți din registrul MBR În acest caz, se face o tranziție la o stare mai mică decât (de exemplu, de la starea la starea sau de la inнііііi ii stare ) Ambele aceste tranziții fac ca registrele MNI I n MBR să fie reîncărcate Când mașina de stări trece la stările , sau , ini-piprug I accesează memoria pentru a apela un cuvânt nou (presupunând că nu este deja ocupat să citească cuvântul anterior) Când sosește cuvântul, nmi p al stării crește cu „Dacă schema de preluare a instrucțiunilor trebuie să funcționeze corect, trebuie și trebuie să fie setată dacă este necesar să efectueze o acțiune pe care nu o poate sări (de exemplu, transferați o valoare la MBR când există doar octet în registrul i/img ) , iar memoria este încă ocupată de chemarea acestui cuvânt) În plus, un colector de comandă nu poate executa mai multe 'ііііііііingіing' în același timp, așa că toate evenimentele primite trebuie să fie transmise la iun 'іііііііоіu În cele din urmă, de fiecare dată când computerul se schimbă, blocul de preluare a instrucțiunilor este actualizat Toate aceste detalii complică munca blocului Cu toate acestea, multe jocuri sunt concepute ca mașini de stat Іі/юк instruction fetch are propriul registru de adrese de memorie, IMAR și este folosit pentru a accesa memorie atunci când aveți nevoie să-nіііііі lume noua Acest registru are o schemă specială de creștere, deci • iar ALU ionic nu trebuie să adauge unul la valoarea PC pentru a apela cuvântul unic Unitatea de preluare a instrucțiunilor trebuie să monitorizeze magistrala C, astfel încât de fiecare dată când registrul PC este încărcat, noua valoare a PC-ului să fie copiată și în IMAR Deoarece noua valoare din registrul RS poate să nu fie la graniță • iiiiiiiii, dispozitivul de preluare a instrucțiunilor trebuie să recupereze cuvântul dorit și să ajusteze nepotrivirile registrului de deplasare în consecință ( h un bloc operativ nou scrie o valoare pe computer numai dacă i și i trebuie să schimbăm caracterul secvenței de octeți Acest lucru se întâmplă în instrucțiunea de salt, precum și în instrucțiunile INVOKEVIRTUAL și IRETURN Deoarece firmware-ul nu mai incrementează în mod explicit computerul pe opcode iii i iovg, unitatea de preluare a instrucțiunilor trebuie să actualizeze computerul însuși Cum se întâmplă asta? IFU este capabil să recunoască faptul că a fost primit un octet din fluxul de instrucțiuni, adică valorile registrelor MBR și MBR (sau variantele lor nesemnate) au fost deja citite O schemă de incrementare separată este asociată cu registrul PC, care crește numărul cu sau , în funcție de câți octeți sunt primiți Astfel, registrul PC conține întotdeauna adresa primului octet neprimit încă La începutul fiecărei instrucțiuni, registrul MBR conține adresa codului operațional al instrucțiunii () Rețineți că există două scheme de creștere diferite care îndeplinesc trei funcții diferite Registrul PC numără octeții și incrementează valoarea cu sau Registrul IMAR numără cuvintele și incrementează valoarea doar cu (pentru patru octeți noi) La fel ca MAR, registrul IMAR este conectat la linia de adresă „dar în diagonală”: bitul al registrului IMAR este conectat la linia de adresă , și așa mai departe, pentru a efectua un salt implicit de la o adresă de cuvânt la o adresă de octet Vom vedea în curând că, dacă nu este nevoie să creștem valoarea PC-ului în bucla principală, acesta este un câștig mare, deoarece de obicei nu se întâmplă nimic altceva în microinstrucțiunea în care are loc creșterea PC-ului Dacă această comandă este eliminată, lungimea căii va fi redusă Cu toate acestea, pentru a crește viteza mașinii, este nevoie de mai mult hardware Astfel, am ajuns la a treia posibilitate de a scurta lungimea căii: Preluarea comenzilor din memorie este efectuată de un bloc funcțional specializat / Preluare comenzi din memorie - Microarhitectura Mis- Blocul de preluare a instrucțiunilor poate reduce semnificativ lungimea căii pentru instrucțiunile dintre II În primul rând, elimină complet bucla principală, deoarece cavalerii fiecărei comenzi pur și simplu sar la următoarea deodată În al doilea rând, ALU nu trebuie să crească valoarea PC-ului În al treilea rând, IFU trunchiază lungimea zero și ori de câte ori se calculează un index de biți sau un offset, înmіb Orez Calea datelor pentru MIS- IV captează o valoare de biți și transmite imediat la ALU ca valoare de de biți fără a fi nevoie să se concateneze în registrul II II fig Figura prezintă microarhitectura Mis- , o versiune îmbunătățită a Mii I, la care unitatea de preluare a comenzii prezentată în fig Firmware-ul pentru mașina îmbunătățită este prezentat în tabel Am "blitz Firmware pentru MIS- Comentariu de operații de microcomandă Port goto (MBR) Treceți la următoarea comandă hulii MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei huli H = TOS H = partea de sus a stivei huli , MDR = TOS = MDR + H; wr; goto (MBR ) Însumarea primelor două cuvinte; scriind suma în poziția de sus a stivei huli MAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei | ul»ZH = TOS H = vârful stivei hnl> MDR = TOS = MDR - H; wr; goto (MBR ) Scădeți TOS din valoarea numită TOS - lutul MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei ІІНПІ H = TOS H = partea de sus a stivei Ipiniz MDR = TOS = MDR AND H; wr; goto (MBR ) Înmulțirea booleană a valorii numite TOS este și TOS (operație AND) lori MAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei lot H = TOS H = partea de sus a stivei h >r MDR = TOS = MDR SAU H; wr; goto (MBR ) Adăugarea booleană a valorii numite TOS - și TOS (operație OR) (lupi MAR = SP = SP + Incrementați SP cu și copiați rezultatul în registrul MAR ilup MDR=TOS; wr; goto (MBR ) Împingeți un cuvânt nou pe stivă popi MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei pop Programul așteaptă finalizarea procesului de citire |n>p TOS = MDR; goto (MBR ) Copiați cuvântul nou în registrul TOS swapl MAR = SP - ; rd Citiți al doilea cuvânt din stivă; setarea registrului MAR la SP continuare & Tabelul (continuare) Comentariu de operații de microcomandă swap MAR = SP Se pregătește pentru a scrie un nou al doilea cuvânt de stivă swap H = MDR; wr Salvați noua valoare TOS; scriind al doilea cuvânt al stivei swap MDR = TOS Copiați valoarea TOS anterioară în registrul MDR swap MAR = SP - ; wr Scrieți valoarea anterioară a TOS în a doua poziție din stivă swap TOS=H; goto (MBR ) Actualizați TOS bipushl SP = MAR = SP + Setați registrul MAR să scrie într-un nou vârf al stivei I)ipush MDR = TOS = MBR ; wr; goto (MBR ) Actualizați stiva în registrul și memoria TOS iloadlMAR=LV+MBR U; rd Mută valoarea LV cu indice în registrul MAR; citește operand iload MAR = SP = SP + Mărește SP cu ; mutați noua valoare SP în registrul MAR ioacic TOS = MDR; wr; goto (MBR ) Actualizați stiva în registrul și memoria TOS istorel MAR = LV + MBR U Setați registrul MAR la LV + index istore MDR=TOS; wr Copiați valoarea TOS pentru a o stoca în memorie istore MAR=SP=SP- ; a rd Scăderea SP cu ; citind noua valoare TOS istore Aparatul așteaptă sfârșitul procesului de citire store TOS=MDR; goto (MBR ) Actualizați TOS widel goto (MBR SAU x ) Următoarea adresă este x SAU opcode wideloadl MAR = LV + MBR U; rd; goto iload La fel ca iloadl, dar folosind un index de octeți wideistorcl MAR=LV+MBR U; goto istore La fel ca istorel, dar folosind un index de octeți Idcwl MAR = CPP + MBR U; rd; goto iload La fel ca iloadl wide, dar indexat din registrul CPP iinclMAR=LV+MBR U; rd Setați registrul MAR la LV + index; citind această valoare Comentariu operațiunilor Mimro-Nmanda Ніи H - MBR Atribuirea unei constante pentru înregistrarea H ihu MDR » MDR + H; wr; goto (MBR ) Creștere prin constantă și actualizare CіНнІ H = PC - Copiați valoarea PC pentru a înregistra H cnip PC = H + MBR Adăugați offset și actualizați computerul CnInZ Aparatul așteaptă ca blocul de preluare a instrucțiunilor să apeleze un nou cod operațional cnio goto (MBR ) Treceți la următoarea comandă іікі MAR = SP = SP - ; rd Citiți al doilea cuvânt din partea de sus a stivei KII OPC = TOS Stocare temporară a TOS în OPC nіі h TOS = MDR Scrieți un nou stivă de sus în TOS IIIU N=OPC; dacă(N) a ajuns la T; altfel mergi la F Sari pe bit N Și"h| MAR = SP = SP - ; rd Citiți al doilea cuvânt din partea de sus a stivei ІІні| OPC = TOS Stocarea temporară a TOS în OPC ІІіч| TOS = MDR Scrieți un nou stivă de sus în TOS Z=OPC; dacă(Z) a ajuns la T; altfel mergi la F Sari pe bit Z Și icmpeql MAR = SP = SP - ; rd Citiți al doilea cuvânt din partea de sus a stivei II I( inpeq MAR = SP = SP - Setați registrul MAR pentru a citi noul vârf al stivei II la inpcq H = MDR; rd Copiați al doilea cuvânt din stivă în înregistrarea H ІІ |cmpcq OPC = TOS Stocarea temporară a TOS în OPC Și Hinpeqo TOS = MDR Punerea unui nou stivă în TOS Și icinpeq Z = H - OPC; dacă(Z) a ajuns la T; else goto F Dacă primele două cuvinte sunt egale, sari la T; dacă nu sunt egale, mergeți la F Г H = PC - ; goto goto La fel ca gotol H = MBR Ignorați octeții în MBR F merge la (MBR ) Invokevirtual MAR = CPP + MBR U; rd Introduceți adresa pointerului procedurii în registrul MAR în vokcvirtual OPC = PC Stochează valoarea PC în registrul OPC continuare & Tabelul (continuare) Comentariu de operații de microcomandă invokevirtua! PC = MDR Setați PC-ul la primul octet al codului de procedură invokevirtual TOS=SP-MBR U TOS=adresă OBJREF - invokevirtua! TOS=MAR=H=TOS+ TOS=OBJREF adresa invokcvirtua! MDR = SP + MBR U + ; wr Suprascrie OBJREF cu indicatorul de legătură invokevirtual MAR = SP = MDR Setați registrele SP și MAR la adresa celulei care conține vechea valoare PC invokevirtua! MDR = OPC; wr Se pregătește pentru salvarea vechii valori a PC-ului invokevirtua! MAR = SP = SP + Crește SP cu ; acum SP indică celula în care este stocată vechea valoare LV invokevirtualO MDR = LV; wr Salvați valoarea LV veche invoca virtual LV=TOS; goto (MBR ) Setați valoarea LV la parametrul nul ireturnl MAR=SP=LV; rd Resetează registrele SP și MAR pentru a citi indicatorul de legătură ireturn Procesul de citire a indicatorului de legătură ireturn LV=MAR=MDR; rd Setați registrele LV și MAR pentru a lega pointerul; citind vechea valoare a RS ireturn MAR = LV + Setați registrul MAR la vechea valoare a LV; citirea valorii LV vechi ireturn PC - MDR; a doua recuperare PC ireturn MAR=SP ireturn LV = MDR LV Recovery ireturn MDR=TOS; wr; goto (MBR ) Stocați rezultatul în partea de sus inițială a stivei Pentru a demonstra cum funcționează Mis- , luați în considerare comanda IADD Scoate al doilea cuvânt din stivă și efectuează adăugarea ca înainte, cu excepția faptului că acum nu trebuie să sară la Maui după ce operația este finalizată pentru a incrementa PC-ul și a trece la următoarea microinstrucțiune Când unitatea de preluare a instrucțiunilor recunoaște că MBR a fost accesat în bucla iadd , registrul său intern de deplasare mută totul spre dreapta și resetează tsіѵzhiіісі MBR și MBR De asemenea, trece la o stare care este cu unul mai puțin decât cea actuală Dacă noua stare este starea , blocul de comandă you-unrcp începe să reamintească cuvântul din memorie Toate acestea sunt implementate în hardware Firmware-ul nu trebuie să facă nimic De aceea comanda IADO poate fi cheltuită de la patru până la trei micro-instrucțiuni În microarhitectura Mis- , unele comenzi sunt îmbunătățite într-o măsură mai mare decât altele Instrucțiunea LDC w este redusă de la la microinstrucțiuni și, i Invariabil, timpul de executare a comenzii este redus cu un factor de trei Pe de altă parte, comanda SWAP conținea inițial micro-comenzi, dar a devenit Pentru performanța generală a computerului, reducerea comenzilor repetate cel mai frecvent joacă un rol, iar acestea sunt comenzile ILOAD (au fost ) , a devenit ), IADD (au fost , au devenit ) ii II ICMPEQ (a fost , a devenit pentru cazul când cuvintele sunt egale; a fost , a devenit '/Nіi caz când cuvintele nu sunt egale) Evaluarea comparativă a performanței sistemului poate fi utilizată pentru a calcula cât de mult s-a îmbunătățit performanța, dar este clar că există un câștig semnificativ de performanță Design transportor - microarhitectura Mis- Evident, microarhitectura lui Mis- este mai perfectă decât Mis- Funcționează mai bine și necesită mai puțină memorie de control, deși costul unității de preluare a instrucțiunilor depășește fără îndoială suma câștigată prin reducerea cantității de memorie de control Astfel, mașina Mis- funcționează mult mai bine - • irg cu o oarecare creștere a costurilor Să vedem dacă Gnmiype mai poate crește viteza Dar dacă încercați să reduceți timpul ciclului? În mare măsură, timpul ciclului este determinat de tehnologia de bază Cu cât tranzistoarele și distanța fizică dintre ele sunt mai mici, cu atât mai rapid poate funcționa integratorul principal În tehnologia pe care o luăm în considerare, timpul necesar călătoriei prin calea datelor este fix (cel puțin din punctul nostru de vedere) Cu toate acestea, avem o oarecare libertate de acțiune și apoi o vom folosi la maximum O altă opțiune de îmbunătățire este creșterea gradului de paralelism În prezent, microarhitectura Mis- realizează cele mai multe operațiuni secvenţial Pune valorile registrului pe autobuze, așteaptă ca ALU și comutatorul să le proceseze, apoi scrie rezultatele înapoi în registre Dacă nu țineți cont de funcționarea blocului de preluare a instrucțiunilor, aici nu există paralelism Introducerea unor mecanisme suplimentare pentru procesarea paralelă promite beneficii semnificative După cum sa menționat deja, timpul ciclului este determinat de timpul necesar pentru ca semnalul să treacă prin calea datelor Pe fig Figura prezintă distribuția acestei întârzieri între diferitele componente în timpul fiecărui ciclu Ciclul căii de date are trei componente principale: Timpul necesar pentru a transfera valorile registrelor selectate către magistralele A și B Timpul necesar pentru funcționarea ALU și a circuitului de schimbare Timpul necesar pentru a transfera valorile primite înapoi în registre și pentru a stoca aceste valori Pe fig Figura prezintă noua arhitectură cu magistrale cu o unitate de preluare a instrucțiunilor și trei zăvoare suplimentare (registre), fiecare situat în mijlocul fiecărei magistrale Aceste registre sunt scrise în fiecare ciclu și împart calea datelor în părți separate care pot funcționa independent unele de altele Vom numi o astfel de arhitectură modelul conductei, sau Mis- Orez Calea datelor cu trei autobuze în microarhitectura Mіs- Dezvoltare la nivel de microarhitectură •kv mFiecare cm are nevoie de trei registre suplimentare? La urma urmei, acum este nevoie de cicluri pentru a trece semnalul prin calea de date: unul pentru a încărca Iristrov A și B, al doilea pentru a porni ALU și circuitul de schimbare, precum și pentru a încărca Vostra C, al treilea pentru a salva valoarea de registrul de blocare C înapoi la nevoie -■-le de registre Suntem anormali? {Sugestie', nu ) Există o zi întreagă în care ■CHI și s introduc registre suplimentare: ■ Putem mări viteza ceasului deoarece întârzierea maximă P este acum mai mică K În timpul fiecărui ciclu, putem folosi toate părțile căii de date b După împărțirea căii de date în trei părți, întârzierea maximă de propagare a semnalului este redusă, ca urmare, frecvența ceasului poate fi mărită Considerăm că dacă rupeți ciclul căii de date în trei |Nr Opt instrucțiuni IJVM necesită o ramură condiționată, care este preluată de al n-lea bit N Când apare o astfel de ramură, conducta nu poate continua De aceea a trebuit să adăugăm un bit re-Ivj la micro-op Când un micro-op cu acest bit ajunge la blocul de așteptare, |doc se abține de la a semnala primirea datelor către blocul decode-Im * Ca rezultat , mașina este inactivă până când această tranziție este rezolvată '■ Probabil, unele instrucțiuni IJVM care nu depind de această tranziție ar putea fi deja transmise blocului de decodare, dar nu și cozii de așteptare, deoarece nu a semnalat încă primirea Pentru a rezolva această confuzie și a reveni la funcționarea normală necesită un dispozitiv special și mecanisme speciale, dar nu le vom lua în considerare în această carte Aici observăm doar că Edgar Dijkstra, care a scris celebrul manifest Despre perniciozitatea comenzilor goto, avea cu siguranță dreptate [Dijkstra, a] Am început cu microarhitectura Mis- și, după ce am parcurs un drum lung, am ajuns la microarhitectura Mis- Hardware-ul microarhitecturii Mis- s-a dovedit a fi foarte simplu, deoarece aproape tot controlul a fost |>salizat în software Microarhitectura Mis- este o structură pipeline cu șapte etape și hardware mai complex Acest transportor este prezentat în Fig Numerele din cercuri corespund Componentelor din fig În microarhitectura Mis- , un flux de octeți este extras automat din memorie în avans, decodificat în comenzi IJVM, care sunt apoi convertite într-o secvență de operații folosind ROM și aplicate conform intenției Primele trei etape ale conductei, dacă se dorește, pot fi asociate cu generatorul principal al căii de date, dar munca nu va avea loc în fiecare ciclu De exemplu, instrucțiunile de preluare cu siguranță nu ar putea trimite un nou opcode către decodor în fiecare ciclu, deoarece instrucțiunea IJVM durează mai multe cicluri pentru a fi executată și coada se va umple rapid Orez Transportor Mis- Bloc de preluare a comenzii la Capitolul Stratul de microarhitectură În fiecare ciclu, valorile registrelor MIR sunt deplasate, iar micro-ul din capul cozii este copiat în registrul MIRI Semnalele de control de la toate cele patru MIR-uri sunt apoi transmise de-a lungul căii de date, provocând acțiuni specifice Fiecare MIR controlează o parte diferită a căii de date și, prin urmare, micropași diferiți Această arhitectură folosește un procesor pipeline, ceea ce face ca pașii individuali să fie foarte scurti și viteza de ceas mare Multe procesoare sunt proiectate astfel, în special cele care trebuie să execute setul de instrucțiuni legacy (CISC) De exemplu, implementarea Coget I este similară în unele privințe cu microarhitectura Mic- , așa cum vom vedea mai târziu în acest capitol Creșterea productivității Toți producătorii de computere doresc ca sistemele lor să funcționeze cât mai repede posibil În această secțiune, vom analiza o serie de tehnologii avansate de performanță a sistemului (în primul rând CPU și memorie) care sunt în prezent cercetate Întrucât concurența în industria calculatoarelor este foarte intensă, de obicei există foarte puțin timp între apariția unei noi idei de creștere a vitezei unui computer și punerea în aplicare a acestei idei Prin urmare, majoritatea ideilor pe care le vom discuta acum, cel mai probabil, sunt deja aplicate în producție Îmbunătățirile luate în considerare pot fi împărțite în două categorii în ceea ce privește implementarea și arhitectura Îmbunătățirile de implementare sunt modalități de a construi un nou procesor și memorie care fac sistemul să ruleze mai rapid fără a schimba arhitectura Schimbarea implementării fără modificarea arhitecturii înseamnă că software-ul moștenit va putea rula pe noua mașină, ceea ce este esențial pentru o vânzare de succes Pentru a îmbunătăți implementarea, puteți, de exemplu, să utilizați un generator master mai rapid, dar aceasta nu este singura modalitate Rețineți că creșterea performanței de la procesorul la , Pentium și modelele ulterioare (cum ar fi Core i ) a fost realizată prin îmbunătățirea implementării, în timp ce arhitectura în ansamblu a rămas neschimbată Cu toate acestea, unele îmbunătățiri pot fi realizate doar prin schimbarea arhitecturii Uneori, de exemplu, trebuie să adăugați instrucțiuni sau registre noi și în așa fel încât programele învechite să poată funcționa pe modele noi În acest caz, pentru a obține performanțe maxime, software-ul trebuie să fie reproiectat sau cel puțin procesat cu un nou compilator pentru a profita de noile funcții Cu toate acestea, o dată la câteva decenii, dezvoltatorii realizează că vechea arhitectură nu mai este bună pentru nimic și singura modalitate de a dezvolta tehnologii în continuare este să o ia de la capăt Apariția arhitecturii RISC în anii a fost un salt atât de revoluționar, iar acum următoarea descoperire se apropie Ne vom uita la un exemplu înrudit (Intel IA- ) în Capitolul Mai târziu în această secțiune, vom acoperi patru tehnici pentru îmbunătățirea performanței procesorului Să începem cu trei bine stabilite Creșterea productivității Îmbunătățiri Enton la implementare, iar apoi treceți la varianta, tre-gmu îmbunătățiri minore în arhitectură Aceste tehnici includ memoria cache, predicția ramurilor, execuția de redimensionare și schimbul de registre și execuția speculativă -memorie Unul dintre cele mai importante aspecte ale proiectării computerelor a fost și este încă, proiectarea unui sistem de memorie care permite ca operanzii să fie transferați la procesor în aceeași rată cu care îi procesează Creșterea rapidă a performanței procesorului, din păcate, nu este însoțită de o creștere la fel de rapidă a vitezei memoriei Față de procesor, acesta devine din ce în ce mai lent Având în vedere importanța extremă a memoriei, această situație, care se deteriorează în fiecare an, împiedică serios dezvoltarea sistemelor de înaltă performanță, forțând dezvoltatorii J&KU și soluțiile alternative * Procesoarele moderne impun anumite cerințe asupra sistemului Limit și în ceea ce privește latența (întârziere în livrarea operandului), și în ceea ce privește lățimea de bandă (cantitatea de date transferate pe unitatea de timp) Din păcate, aceste două aspecte ale sistemului de memorie sunt în mare măsură inconsecvente De obicei, pe măsură ce debitul crește, Latența crește De exemplu, tehnologiile pipeline pe care le-am folosit în microarhitectura Mis- pot fi aplicate și sistemului de memorie, caz în care transferurile de memorie vor fi procesate mai rațional, cu suprapunere Cu toate acestea, din păcate, ca și în microarhitectura Mis- , acest lucru duce la o creștere a timpului de așteptare pentru operațiunile individuale de memorie Pe măsură ce viteza oscilatorului crește, devine din ce în ce mai dificilă menținerea unui sistem de memorie care poate transfera operanzi în unul sau două cicluri O soluție la problemă este adăugarea memoriei cache După cum am observat în secțiunea „Cache” a secțiunii „Memorie principală” a capitolului , cuvintele cele mai frecvent utilizate sunt stocate în memoria cache, accelerând astfel accesul la ele Dacă un procent suficient de mare din cuvintele dorite se află în cache, timpul de așteptare poate fi redus semnificativ Una dintre cele mai eficiente tehnici pentru creșterea debitului și reducerea latenței în același timp este utilizarea mai multor blocuri cache Tehnica principală este introducerea unor cache separate pentru comenzi și date (așa-numita memorie cache partajată) Un astfel de cache are mai multe avantaje, în special, operațiunile pot începe independent în fiecare cache, ceea ce dublează debitul sistemului de memorie Din acest motiv, în microarhitectura Mis- aveam nevoie de două porturi de memorie separate: un port separat pentru fiecare cache Rețineți că fiecare cache are acces independent la memoria principală În zilele noastre, multe sisteme de memorie sunt mult mai complexe decât acestea Cache-ul L este adesea plasat între memoria cache partajată și memoria principală În general, pe măsură ce cerințele de memorie cresc, numărul de niveluri de cache poate ajunge la trei sau mai mult Pe fig Figura prezintă un sistem cu trei niveluri de cache Direct pe cipul CPU Ilam f nivelul microarhitecturii există un mic cache pentru instrucțiuni (LI-I) și un mic cache pentru date (L -D), de obicei de la la KB Există, de asemenea, o memorie cache de nivel al doilea (E ), care se află nu pe cipul procesorului în sine, ci lângă ea în acel bloc ZhG Cache-ul L este conectat la procesor printr-o cale de date de mare viteză Acest cache nu este de obicei partiționat și reține date și instrucțiuni împreună Dimensiunea sa este de la KB la MB Cache-ul L se află pe aceeași placă ca și procesorul și constă de obicei din câțiva megaocteți de RAM statică, care este mult mai rapidă decât memoria principală DRAM De obicei, întregul conținut* al cache-ului L se află în cache-ul L , iar întregul conținut al cache-ului L se află în cache-ul L Cadru procesor Cip de procesor Cache L partiționat Placa procesorului Cache L pentru instrucțiuni Cache primul nivel pentru date Cache L consolidat Cache L unificat Memoria principală (RAM dinamică) Controler cu tastatură Controler grafic Controler de disc Memoria cache pe placa procesorului (RAM statică) Orez Sistem cu trei niveluri de cache Există două opțiuni pentru localizarea adresei, de care depinde funcționarea memoriei cache Localizarea spațială se bazează pe probabilitatea ca în viitorul apropiat să fie nevoie de acces la celulele de memorie situate lângă celulele numite recent Pe baza acestei observații, în cache sunt transferate mai multe date decât este necesar în prezent Localizarea temporală are loc atunci când celulele apelate recent sunt solicitate din nou Acest lucru se poate întâmpla, de exemplu, cu celulele de memorie din partea de sus a stivei sau cu instrucțiuni în interiorul unei bucle Principiul localizării temporale este folosit pentru a selecta elementele care ar trebui eliminate din cache în cazul unei pierderi de cache De obicei, acele elemente care nu au fost accesate de mult timp sunt șterse Toate tipurile de cache folosesc următorul model Memoria principală este împărțită în blocuri de dimensiuni fixe numite șiruri Creșterea productivității M O linie cache I constă din mai mulți octeți consecutivi (de obicei de la I) Liniile sunt numerotate începând de la , adică dacă dimensiunea liniei este unu, atunci linia este octeții de la la , linia este octeții de la la etc Există mai multe linii în cache în acest moment Când are loc o atingere de memorie, controlerul cache verifică dacă există cuvântul de memorie dorit Dacă există un cuvânt (cazul unei lovituri în cache), atunci puteți salva accesul necesar la memoria principală Dacă cuvântul dat se află în memoria cache (learn cache miss), atunci una dintre liniile din cache este ștearsă și, în schimb, linia solicitată din memoria principală sau din memoria cache este plasată acolo cu un nivel mai mare de ' Există multe variante ale acestei scheme, dar se bazează pe ideea de a păstra în cache cât mai multe *roci utilizate frecvent, astfel încât numărul de accesări în cache să fie maximizat Ivsh - Memorie mapată directă Cel mai simplu tip de cache este un cache mapat direct Un exemplu de cache mapat direct DLC este prezentat în Fig , a Această memorie conține de elemente Fiecare element (rând) poate deține {OVNO un termen din memoria principală Dacă dimensiunea liniei de cache este de octeți (ca în acest exemplu), memoria cache poate conține KB Fiecare memorie cache a lui Lems constă din trei părți: + Bitul de validitate indică dacă există sau nu date valide în element Când sistemul pornește, toate elementele sunt marcate ca nevalide Pic Biți Tag String Word Byte b Orez Cache de cartografiere directă (a); Adresă virtuală pe de biți (b) Capitolul Stratul de microarhitectură + Câmpul de etichetă constă dintr-o valoare unică de biți, indicând linia corespunzătoare de memorie din care provin datele + Câmpul de date conține o copie a datelor de memorie Acest câmp conține o linie cache OJ de de octeți În memoria cache mapată direct, un anumit cuvânt poate fi stocat doar într-un singur loc Dacă nu este în acest loc, atunci nu este deloc în cache Pentru a stoca date în cache și a le prelua din cache, adresa este împărțită în componente, așa cum se arată în Fig b: + Câmpul de etichetă corespunde biților stocați în câmpul de etichetă al elementului QEC de indentare + I Іole al liniei indică ce element de cache conține * corespunzător date, dacă acestea există în cache + Câmpul cuvânt indică ce cuvânt din șir este referit + Câmpul octet nu este utilizat în mod normal, dar dacă este necesar doar un octet, acest câmp indică exact ce octet din cuvânt este necesar Pentru o memorie cache care acceptă numai cuvinte pe de biți, acest câmp conține întotdeauna Oe* Când CPU emite o adresă de memorie, hardware-ul alocă biți din câmpul șir de la acea adresă și îi folosește pentru a căuta una dintre cele de intrări din cache Dacă elementul este valid, atunci se face o comparație între câmpul etichetei de memorie principală și câmpul etichetei cache Dacă câmpurile sunt egale, atunci memoria cache conține cuvântul solicitat Această situație se numește hit cache În cazul unei lovituri în cache, cuvântul este preluat direct din cache și apoi nu este nevoie să accesați memoria principală Din elementul cache este luat doar cuvântul dorit, restul elementului nu este folosit Dacă elementul cache este invalid (invalid) sau câmpurile de etichetă nu se potrivesc, atunci cuvântul dorit nu este în memorie Această situație se numește cache miss În acest caz, șirul de de octeți este preluat din memoria principală și stocat în cache, înlocuind orice element a fost acolo Cu toate acestea, dacă o intrare în cache existentă este modificată, aceasta trebuie scrisă înapoi în memoria principală înainte de a putea fi înlocuit În ciuda complexității soluției, accesul la cuvântul dorit poate fi extrem de rapid Deoarece adresa este cunoscută, este cunoscută și locația exactă a cuvântului, dacă acesta există în cache Aceasta înseamnă că trebuie să citiți cuvântul din cache, să îl livrați procesorului și, în același timp, să verificați dacă acest cuvânt este corect (comparând câmpurile etichetei) Prin urmare, procesorul primește de fapt cuvântul din cache în același timp sau chiar înainte de a ști dacă cuvântul solicitat este sau nu Cu această schemă, liniile contigue ale memoriei principale sunt plasate în intrările în cache adiacente De fapt, în cache pot fi stocate până la KB de date contigue Cu toate acestea, două șiruri de caractere ale căror adrese diferă cu exact KB ( octeți) sau orice multiplu întreg al acelui număr nu pot fi stocate în cache în același timp (deoarece au aceeași valoare a câmpului șirului) De exemplu, dacă un program accesează date la adresa X și apoi execută o instrucțiune care necesită date la adresa X (sau orice altă adresă de pe aceeași linie), a doua instrucțiune necesită reîncărcarea unei intrări în cache Dacă acest lucru se întâmplă destul de des, atunci Performanta imbunatatita ■b probleme Dacă memoria cache nu funcționează bine, este mai bine să nu aveți deloc un cache, deoarece fiecare operație de pe memoria principală citește o mână întreagă, nu un singur cuvânt Direct Mapping Cache este cel mai comun tip de cache Shiyati și este destul de eficient deoarece coliziunile ca aceasta sunt foarte rare sau nu se întâmplă niciodată De exemplu, un ■Mpilator de înaltă calitate poate lua în considerare astfel de coliziuni atunci când plasează instrucțiunile #DyPpp în memorie Rețineți că acest caz nu va apărea în sistem, comenzile și datele b sunt stocate separat, deoarece solicitările conflictuale ■ Trebuie să fie servite de cache-uri diferite Astfel, vedem al doilea avantaj de a avea două cache-uri în loc de unul - mai multă flexibilitate în rezolvarea situațiilor de conflict ^• memorie cache oocative cu acces multiplu C&K a fost notat mai devreme, diferite linii de memorie principală concurează pentru dreptul de a ocupa aceeași zonă de cache Dacă programul care utilizează psh-memory prezentat în Fig , a, cuvinte cu adrese O ț| , atunci vor exista conflicte constante, deoarece fiecare par-rpcchie va atrage potențial expulzarea uneia sau alteia rânduri din cache Pentru a rezolva această problemă, trebuie să vă asigurați că fiecare cache ^Cement se potrivește cu două sau mai multe linii Un cache cu n intrări posibile pentru fiecare adresă se numește memorie asociativă MSH cu n intrări Cache-ul asociativ cu căi este prezentat în fig Bit Bit Bit Bit 'ѵ - - > - J Element A Element B Element C Element D Orez Cache asociativ cu căi Un cache asociativ cu acces multiplu este în mod inerent mult mai complex decât un cache mapat direct, deoarece, deși o intrare în cache poate fi calculată dintr-o adresă de memorie principală, trebuie verificat dacă De fapt, astfel de ciocniri nu sunt atât de rare datorită faptului că, cu metoda de paginare de organizare a memoriei virtuale și execuția paralelă a mai multor sarcini, paginile par a fi „mixte” Paginarea programului se realizează aleatoriu, astfel încât „localitatea codului” poate fi încălcată - Notă științific ed Plav Nivel de microarhitectură A elementele cache pentru a vedea dacă linia de care avem nevoie este acolo Cu OD, verificarea trebuie făcută foarte rapid Cu toate acestea, practica arată că un cache asociativ cu sau căi dă rezultate bune, PO | introducerea acestor scheme suplimentare este pe deplin justificată Utilizarea unui cache asociativ cu acces multiplu oferă dezvoltatorului o alegere Dacă un element nou trebuie plasat în cache, care dintre elementele vechi ar trebui eliminat? Pentru majoritatea problemelor, algoritmul de procesare a unui element care nu a fost folosit de mult timp (Least Recenly Used, LRU) este bine potrivit Există o specie specifică a fiecărui set de celule disponibile dintr-o celulă de memorie dată De fiecare dată când COP accesează orice rând, conform algoritmului LRtl, lista este actualizată, iar elementul care a fost accesat ultima dată este marcat Când este necesară înlocuirea oricărui element, se elimină T(L) care se află la sfârșitul listei, adică cel care a fost folosit de ceilalți Este posibil și un caz extrem - un cache asociativ cu de moduri care conține un singur set de elemente În acest caz, toate adresele de memorie ajung în acest set, astfel încât căutarea necesită compararea adresei dorite cu toate cele de etichete din cache Rețineți că fiecare element al memoriei cache trebuie să conțină un circuit logic special pentru aceasta Deoarece câmpul șir în acest caz este un câmp marcator, câmpul etichetă este întreaga adresă, cu excepția câmpurilor de cuvânt și octet Mai mult, atunci când o linie de cache este înlocuită, toate cele de elemente sunt posibile candidați pentru înlocuire Stocarea unei liste ordonate de de articole ar necesita o gestionare greoaie a resurselor sistemului, astfel încât algoritmul LRU este ineficient (Reamintim că lista trebuie actualizată cu fiecare operațiune de memorie ) Interesant, un cache cu un număr mare inputs nu depășește întotdeauna memoria cache, în care numărul de intrări este mic, iar în unele cazuri funcționează și mai rău Prin urmare, numărul de intrări mai mare de patru este rar În cele din urmă, scrierile sunt o problemă specială pentru memoria cache Când procesorul scrie un cuvânt și cuvântul se află în cache, trebuie evident fie să actualizeze cuvântul, fie să ștergă intrarea în cache În aproape toate evoluțiile, are loc o actualizare a memoriei cache Dar cum rămâne cu actualizarea copiei din memoria principală? Această operațiune poate fi amânată până mai târziu până când linia cache este gata să fie înlocuită în conformitate cu algoritmul LRU Alegerea este dificilă și nici una dintre soluții nu este preferată Actualizarea imediată a elementului de memorie principal se numește write-through Această abordare este de obicei mult mai ușor de implementat și, în plus, este mai fiabilă, deoarece memoria modernă își poate restabili întotdeauna starea anterioară în cazul unei erori Din păcate, acest lucru necesită transferarea mai multor date în memorie, așa că în proiectele complexe, aceștia tind să folosească o abordare alternativă - writeback sau scriere întârziată Există o altă problemă cu procesul de scriere: ce se întâmplă dacă trebuie să scrieți ceva într-o locație care nu este în cache? Ar trebui ca datele să fie trimise în cache sau doar scrise în memoria principală? Din nou, niciunul dintre răspunsuri nu este cel mai bun din toate punctele de vedere În majoritatea evoluțiilor, F ■ În al doilea rând, se aplică writeback, datele sunt transferate în cache Această practică se numește alocare de scriere Pe de altă parte, în acele modele în care se folosește write-through, elementul nu este de obicei plasat în cache-ul C-write, deoarece acest lucru complică sistemul Umplutura Nmnisi este utilă numai dacă există intrări |DNO repetate pentru același cuvânt sau pentru cuvinte diferite în aceeași linie de cache Eficiența і(|k|)caching-ului este o condiție extrem de importantă pentru îmbunătățirea performanței |T|TH a sistemului din cauza decalajului uriaș dintre vitezele procesorului și memoriei Discuția despre strategiile alternative pentru stocarea în cache este în desfășurare [Sanchez și Kozyrakis, ; Gaur și colab , ] Predicția tranziției Calculatoarele principale В»І X' sunt în mare parte conectate Transportorul prezentat în fig are șapte trepte; doiputerii mai complexe conțin conducte cu zece sau mai multe etape Pipelining fchs funcționează cu un cod liniar, astfel încât instrumentul de preluare a instrucțiunilor poate pur și simplu să preia DOT cuvinte consecutive din memorie și să le trimită la decodor înainte de timp, chiar înainte de a fi necesare Singura problemă este că acest model este complet nerealist Programele nu sunt deloc secvențe liniare ale IPMnd - sunt pline de instrucțiuni de salt Luați în considerare comenzile simple din Listarea Variabila i este comparată cu (probabil cea mai comună comparație în practică) În funcție de rezultatul celeilalte variabile, lui ! i se atribuie una dintre cele două valori posibile Lista Fragment de program ІНі- ) k=l; •ite k= ; O posibilă traducere în limbaj de asamblare este prezentată în Listarea Limbajul de asamblare va fi discutat mai târziu în această carte, dar deocamdată este suficient să știm că este posibil un program mai mult sau mai puțin ca Polis din Listarea Prima comandă compară variabila i cu zero Al doilea sare la eticheta Else (începutul secțiunii else) dacă i nu este egal cu A treia instrucțiune atribuie variabilei k valoarea A patra instrucțiune sare la următoarea instrucțiune de program Compilatorul a pus eticheta Next acolo A cincea comandă atribuie valoarea variabilei k Lista Listarea după traducerea în limbaj de asamblare domnule i, BNE Else thtn: MOV k, BR În continuare F*e: MOV k, Nt"xt: ; comparând i cu ; sari la Else daca nu sunt egali ; atribuirea valorii unei variabile la ; salt necondiționat la Următorul ; atribuirea valorii unei variabile la Vedem că două dintre cele cinci comenzi sunt comenzi de tranziție Mai mult decât atât, una dintre ele, bne, este o instrucțiune de ramură condiționată (o ramură care Capitolul Stratul de microarhitectură se efectuează dacă și numai dacă se execută o anumită mustață în acest caz - aceasta este egalitatea celor doi operanzi ai instrucțiunii anterioare Cel mai lung cod liniar de aici este format din două instrucțiuni, deci este dificil să organizați o conductă de mare viteză La prima vedere, salturile necondiționate, cum ar fi comanda BR Next din Listarea , ar putea să nu pară o problemă LA vorbind, în acest caz nu există nicio ambiguitate cu privire la unde să mergem în continuare De ce nu poate unitatea de preluare a instrucțiunii să citească în continuare k de la adresa de destinație (adică de unde se face saltul)? Este foarte convenabil să adăugați de îndată ce apare valoarea lui k (chiar înaintea instrucțiunii condiționale if), dar nu este de dorit să stocați rezultatele în memorie Pentru a preveni suprascrierea registrelor înainte de a se ști dacă rezultatele sunt necesare, trebuie să înlocuiți toate registrele de ieșire care sunt utilizate de instrucțiunea speculativă După cum vă puteți imagina, contorul de acces pentru a ține evidența tuturor acestor situații este foarte complex, dar cu hardware-ul potrivit, este destul de posibil să creați unul Cu toate acestea, în prezența instrucțiunilor speculative, apare o altă problemă care nu poate fi rezolvată prin înlocuirea registrului Ce se întâmplă dacă o comandă speculativă aruncă o excepție? Un exemplu este comanda LOAD, care provoacă o pierdere a memoriei cache pe un computer cu o linie de cache suficient de mare (să zicem de octeți) și memorie care este mult mai lentă decât CPU și cache Dacă avem nevoie de o comandă LOAD și mașina se oprește pentru câteva cicluri în timp ce linia cache este încărcată, atunci acest lucru nu este atât de rău, deoarece acest cuvânt este cu adevărat necesar Dar dacă mașina este inactivă pentru a striga un cuvânt, care, după cum se dovedește mai târziu, nu ne este de nici un folos, acest lucru este complet irațional Dacă există prea multe astfel de „optimizări*”, atunci procesorul central va funcționa mai lent decât (dacă nu au existat „optimizări” deloc (Dacă mașina conține o memorie virtuală, care este discutată în Capitolul , atunci execuția speculativă este I Exemple de niveluri de microvrhitѵkіursh oog ILOAD poate cauza chiar accesarea unei pagini lipsă Similar: și poate afecta semnificativ performanța, deci este important să le folosiți ) > otrava computerelor moderne, această problemă este rezolvată prin următoarele > m Aceștia acceptă o comandă specială SPECULATIVE-LOAD, care codifică o încercare de a apela un cuvânt din cache, iar dacă cuvântul nu este acolo, pur și simplu caută un apel Dacă o valoare este găsită în cache și este validă, poate fi folosită, iar dacă nu este în cache, hardware-ul o va prelua imediat Dacă atunci se dovedește că această valoare nu este pentru noi), atunci nu va exista nicio pierdere de timp Situația dificilă poate fi ilustrată de următorul operator: > ) Z = y/x; Aici x, y și z sunt variabile în virgulă mobilă Să presupunem că toate aceste variabile intră în registre în avans, iar instrucțiunea de diviziune flotantă (această instrucțiune este lentă) se deplasează în sus pe grafic și este executată chiar înainte de instrucțiunea condițională if Din nefericire, dacă valoarea lui x este , fO programul se termină ca urmare a unei încercări de împărțire la Astfel, instrucțiunea Meculative provoacă un eșec într-un program inițial corect Mai rău este că programatorul schimbă programul pentru a preveni o astfel de situație, dar eșecul încă apare O soluție posibilă este versiunile speciale ale acelor comenzi care POT arunca excepții În plus, la fiecare registru se adaugă un așa-numit bit otravă Dacă instrucțiunea speculativă eșuează, nu declanșează o capcană de excepție, ci setează bitul otravă ȘI registrul rezultat Dacă acest registru este apoi folosit de o instrucțiune normală, excepția este capturată (cum ar trebui să fie în cazul unei excepții) Cu toate acestea, dacă acest rezultat nu este utilizat, bitul otravă este resetat și crește pentru a nu afecta fluxul programului Exemple la nivel de microarhitectură În această secțiune, în lumina materialului abordat în acest capitol, ne vom uita la trei procesoare moderne Prezentarea noastră va fi scurtă, deoarece computerele sunt extrem de complexe, conținând milioane de porți și nu suntem în măsură să oferim o descriere detaliată Procesoarele oferite ca exemple sunt aceleași ca înainte - Coge i , OMAP și ATmegal Microarhitectura procesorului Coge i La prima vedere, Cope I pare a fi o mașină CISC destul de tradițională, cu un set de instrucțiuni mare și greoi care acceptă operații cu numere întregi pe , și de biți, precum și operațiuni cu virgulă mobilă pe și de biți Are doar registre disponibile pe procesor, iar niciunul nu le repetă pe celelalte Lungimea admisă a comenzii este de - octeți În general, există o arhitectură moștenită standard care face totul greșit OU i lava h nivel de microarhitectură De fapt, procesorul Coge i se bazează pe nuclee RISC moderne cu pipelining avansat Viteza sa de ceas este deja foarte Mka, iar în următorii ani este probabil să crească și mai mult Uimitorii ingineri Intel, bazați pe o arhitectură arhaică, au reușit să construiască un proces care îndeplinește toate cerințele moderne Deci, în această subsecțiune, ne uităm la microarhitectura Coge I și înțelegem principiile funcționării acesteia '( Prezentare generală a microarhitecturii Sandy Bridge Microarhitectura Core i , denumită Sandy Bridge, a marcat o abatere semnificativă față de generațiile anterioare de microarhitecturi, inclusiv P și Orez Microarhitectura Core I Coge i constă din patru blocuri principale: un subsistem de memorie, un bloc de preprocesare, un bloc de control al execuției cu o modificare a secvenței și un bloc de execuție Luați în considerare aceste blocuri în ordine, începând din stânga sus și mișcându-se în sens invers acelor de ceasornic Fiecare procesor Coge I conține un subsistem de memorie cu un cache L (L ) partajat, precum și logica de acces la cache L (L ) Toate procesoarele au o cache comună de nivel - aceasta este „ultima oprire”, după care accesul părăsește cipul CPU și este trimis prin autobuz într-o călătorie foarte lungă către memoria externă Volumul cache-urilor L în Cor i este de KB; sunt un cache asociativ cu căi cu linii de de octeți Mărimea memoriei cache L partajată variază de la la MB Cu cât plătiți mai mult Intel, cu atât mai mare va fi memoria cache Indiferent de dimensiune, cache-ul L este exemple la nivel de microarhitectură ooh Cache asociativă ID cu linii de de octeți Dacă o solicitare la nivelul cache-ului eșuează, aceasta este transferată în memoria externă prin l)l)R Există două dispozitive de preluare preliminare asociate cu e-pem-urile de prim nivel (nu sunt prezentate în figură) care încearcă să transfere date din memoria principală înainte ca datele să fie solicitate Un bloc preface următorul bloc de memorie atunci când întâlnește o memorie secvențială ca transmisă procesorului Al doilea bloc de limitare, mai complex, ține evidența secvenței de adresă citită/ a unui anumit program Dacă operațiunile sunt efectuate cu o constantă (de exemplu, x x x ), blocul preselectează următorul, care este cel mai probabil să fie accesat de program Preluarea (' în incremente constante este extrem de eficientă în programele care preiau matrice de variabile structurate Subsistemul de memorie din fig G este asociat atât cu preprocesorul, cât și cu memoria cache de date L Blocul de preprocesare este responsabil pentru preluarea instrucțiunilor din subsistemul de memorie, decodificarea lor în micro-opțiuni în stil RISC și stocarea lor în două cache de instrucțiuni Toate instrucțiunile după lucru sunt plasate în memoria cache de instrucțiuni L (primul nivel) Mărimea cache-ului L este de KB, este o memorie cache asociativă cu intrări £ (în șiruri de octeți În timpul preluării din cache-ul L , comenzile se încadrează în ds-IODgrі, care determină secvența micro-operațiilor utilizate pentru a implementa comanda în conducta de execuție Mecanismul de decodare vă permite să „construiți punți” între setul de instrucțiuni CISC moștenit și calea de date RISC modernă Micro-op-urile decodificate sunt trecute în memoria cache-ului micro-op, la care Intel se referă ca „cache-ul de instrucțiuni L (nivel zero)” Cache-ul micro-op seamănă cu un cache tradițional de instrucțiuni, dar are suficient spațiu pentru a stoca secvențe de micro-operații generate de instrucțiuni individuale Deoarece nu instrucțiunile originale sunt memorate în cache, ci micro-opțiunile decodate, nu este nevoie de re-decodare în timpul execuțiilor ulterioare ale comenzii La prima vedere, poate părea că Intel a făcut ceva pentru a accelera conducta (într-adevăr, memorarea în cache accelerează procesul de generare a instrucțiunilor), dar Intel susține că memoria cache micro-op a fost adăugată pentru a reduce consumul de energie de către preprocesor Cu un cache de microoperații, restul blocului petrece % din timp în modul „sleep” cu un consum minim de energie Predicția ramurilor este realizată și în blocul de preprocesare Predictorul trebuie să „ghicească” când execuția programului se va abate de la o probă strict secvențială și trebuie să facă acest lucru cu mult înainte de execuția instrucțiunilor de tranziție În Cor i acest bloc funcționează foarte eficient Din păcate, în majoritatea arhitecturilor, detaliile predictorilor de ramuri sunt ținute secrete Faptul este că performanța predictorului este adesea cel mai important factor care determină viteza globală a arhitecturii Cu cât proiectanții de putere predictivă stoarce din fiecare milimetru pătrat de siliciu, cu atât performanța întregii arhitecturi este mai mare De aceasta acu nivel de microarhitectură ilvvn Acesta este motivul pentru care companiile își păstrează secretele sub cheie și chiar amenință lucrătorii FD cu acțiuni în justiție dacă doresc să-și împărtășească cunoștințele prețioase Este suficient să spunem că toate blocurile de predicție urmăresc rezultatele tranzițiilor anterioare și folosesc aceste informații pentru predicțiile DAR Secretul este să alcătuiți o listă detaliată de trasabile pentru a arăta cum sunt stocate și utilizate La urma urmei, dacă găsești dintr-o dată o modalitate incredibilă de a prezice viitorul, nici nu o pui pe internet pentru ca toată lumea să o vadă Instrucțiunile sunt transmise din memoria cache micro-op către programatorul de instrucțiuni ordine determinată de program, dar atunci când sunt executate, mă pot abate de la această ordine După ce a găsit un micro-operator care nu poate fi executat, Command Scheduler îl menține în timp ce continuă să proceseze comenzile - sunt lansate toate comenzile ulterioare care nu necesită resurse suplimentare (registre, blocuri funcționale etc ) Aici Da se realizează înlocuirea registrului, datorită căreia RĂZBOIUL și WAW sunt interdependente comenzile pot fi executate fără întârziere lі Deși ordinea în care sunt emise comenzile poate diferi de cea specificată în program, cerința de precizie a întreruperii Coge I prevede că rezultatele execuției comenzilor ISA trebuie făcute vizibile pentru program fără a se abate de la secvența specificată de program Blocul stațiunii este responsabil pentru implementarea acestei cerințe » Unitățile de execuție implementează direct operațiuni cu numere întregi în virgulă mobilă și instrucțiuni specializate Există mai multe unități de execuție care funcționează în paralel Ei primesc date din fișierul de registru și din memoria cache a datelor de la primul nivel Conveyor Sandy Bridge la Coge i eu ia fig Figura prezintă o diagramă simplificată a microarhitecturii Sandy Bridge, inclusiv conducta acesteia În partea de sus a diagramei este un bloc de preprocesare responsabil pentru preluarea instrucțiunilor din memorie și pregătirea lor pentru execuție Acest bloc primește noi instrucțiuni x din memoria cache de instrucțiuni de primul nivel Acestea sunt decodificate în micro-op-uri și plasate într-un cache-micro-op care conține aproximativ , K micro-op-uri În ceea ce privește performanța, este comparabil cu un cache tradițional de nivel zero de KB În memoria cache a micro-operațiunilor, fiecare șase micro-operații sunt combinate într-un grup care ocupă o linie Pentru a forma secvențe mai lungi de micro-operații, se folosește concatenarea șirurilor Dacă blocul de decodare întâlnește o ramură condiționată, se întoarce la blocul de predicție a ramurii pentru informații Acest bloc conține un istoric al salturilor care au avut loc în trecut și, pe baza datelor acumulate, sugerează dacă un salt condiționat va fi efectuat atunci când va avea loc următoarea în program Aici sunt utilizați algoritmii secreti menționați mai sus Dacă comanda de salt nu este în tabel, se aplică predicția statică Aceasta implică faptul că tranziția inversă, în primul rând, face parte din ciclu și, în al doilea rând, se presupune implicit că va fi efectuată Precizia prognozei statice în acest caz este foarte mare Drept Bloc de preprocesare І'Н№!'ІІІ ІПНПІЦІМКІШІ Bloc de decodare Branch Predictor / Branch Object Buffer Kinirol inyulnvnia MNMvneni-•M secvență Distribuția și înlocuirea blocurilor G și Pentru cache partajată de nivel ALU ALU -' : ALU ka Conservare Încărcare - Încărcare Bloc stațiune Orez Diagrama simplificată a căii de date Core I în ieșire este considerată a fi parte a structurii instrucțiunii if și nu este executată implicit Precizia unei prognoze statice în cazul tranzițiilor directe valoare-input este mai mică decât în cazul celor inverse Pentru ramura selectată, adresa de destinație este determinată din conținutul bufferului de ramură, sau BTB BTB stochează adresa de destinație a saltului de la ultima execuție Această adresă este de obicei corectă (de fapt, este întotdeauna invalidă pentru salturi cu un offset constant) Salturile indirecte (de exemplu, cele utilizate în apelurile de funcții virtuale și în comenzile C++ * »wltch) merg la adrese diferite și vor fi prezise eronat din datele IITB A doua componentă a conductei, logica de execuție a resecvenței, primește date din memoria cache-ului micro-op Când fiecare micro-operație ulterioară sosește din stocul de preprocesare (și există trei dintre ele pe nichel), blocul de distribuție și substituție o înregistrează în ta-Gnipcs, constând din de intrări și numită comanda de reordonare buffer (ReOrder Buffer, ROB) Acest buffer stochează date despre starea micro-operației, până la resortarea rezultatelor acesteia Apoi blocul de distribuție și substituție verifică disponibilitatea resurselor necesare realizării micro-operației Dacă resursele sunt libere, micro-operația este instalată într-una dintre cozile programatorului Sunt furnizate cozi separate pentru micro-operațiunile executate în memorie și în afara memoriei Dacă executarea unei micro-operații este imposibilă în prezent, aceasta se amână, dar procesarea micro-operațiilor ulterioare continuă; astfel, micro-opțiunile sunt adesea executate în afara secvenței lor inițiale Acest principiu vă permite să susțineți încărcarea tuturor blocurilor funcționale cel mai înalt nivel posibil În orice moment, până la de comenzi pot fi procesate simultan, dintre care pot fi încărcate din memorie, iar pot fi stocate în memorie Uneori, micro-operatorii sunt inactiv Acest lucru se întâmplă în acele cazuri când unul și același registru pentru citire sau scriere încearcă să acceseze câte micro-operații; în consecință, unul dintre ei reușește, în timp ce ceilalți nu Astfel de conflicte, după cum am aflat deja, se numesc interdependențe WAR și WAW Înlocuirea registrului țintă vă permite să scrieți rezultatele execuției microoperației într-unul dintre cele de registre temporare și znachi executați imediat această micro-operație Dacă toate registrele temporare nu sunt disponibile sau micro-operatorul intră într-o situație de dependență RAW (care nu poate fi ocolită), planificatorul indică natura problemei ca o intrare în buffer-ul ROB Ulterior, după ce se eliberează resursele necesare, microoperația este plasată într-una dintre cozile de execuție Cozile de planificare plasează operațiuni gata de executat într-unul din cele șase blocuri funcționale: ALU și unitatea de multiplicare în virgulă mobilă Blocul de adunare/scădere ALU și virgulă mobilă ALU , ramură în virgulă mobilă și unitate de procesare a comparației Salvați comenzile Descărcați comenzi Descărcați comenzi Deoarece programatoarele și ALU-urile pot procesa o operație pe ciclu, performanța programatorului Cope i de GHz atinge miliarde de operațiuni întregi pe secundă; totuși, în practică, această viteză nu este niciodată atinsă Deși blocurile funcționale nu pot oferi o încărcătură completă de resurse executive, o fac! putere de execuție suficientă, motiv pentru care unitatea de control al secvenței caută cu atâta sârguință locuri de muncă pentru ei Cele trei ALU-uri întregi nu sunt la fel ALU efectuează orice operații aritmetice și logice, înmulțiri și împărțiri ALU este capabil doar să efectueze operații aritmetice și logice ALU efectuează operații aritmetice și logice, precum și rezoluția tranzițiilor Cele două blocuri de execuție în virgulă mobilă nu sunt, de asemenea, identice Primul acceptă aritmetica în virgulă mobilă, inclusiv înmulțirea, în timp ce cel de-al doilea poate efectua doar adunări și scăderi în virgulă mobilă, precum și mișcări Unitățile de execuție ALU și în virgulă mobilă primesc date din două fișiere de registru cu o capacitate de de intrări Unul dintre aceste fișiere este pentru numere întregi, celălalt pentru numere în virgulă mobilă Acestea conțin toți operanzii necesari executării instrucțiunilor; în plus, ele joacă rolul unui depozit de rezultate Datorită înlocuirii registrelor, opt dintre ele conțin registre disponibile la nivelul arhitecturii instrucțiunilor (EAX, EBX, ECX, EDX etc ), dar locația valorilor „reale” în fiecare caz depinde de modificările în maparea care apar în timpul execuției Arhitectura Sandy Bridge II a introdus AVX (Advanced Vector I Heiinons), oferind suport pentru operații vectoriale pe de biți, izh|i'i'іg/іyіy pe date (atât cu vectori întregi, cât și cu vectori • n'іyіshyuіtsey dot) În noua extensie ISA, dimensiunea vectorului este dublă față de dimensiunea extensiilor ISA anterioare SSE și SSE Cum este arhitectura operațiunilor I»» ii'iii uier pe de biți cu căi de date pe de biți și funcții bloc ii/ii? Două porturi de planificare pe de biți sunt combinate • în formarea unui bloc funcţional de de biţi Primul tip de date de strat este strâns legat de conducta internă a Sandy Bridge Această memorie cache de de kiloocteți poate stoca numere întregi, numere în virgulă mobilă și alte tipuri de date Spre deosebire de cache-ul micro-op, aceste date nu sunt decodificate în niciun fel Funcția cache-ului i'іnііх (conduce la stocarea de copii ale octeților care se află în memorie În ceea ce privește caracteristicile sale, cache-ul de date de la primul nivel este un cache asociativ cu intrări cu o capacitate de linie de de octeți Acceptă în alte cuvinte, atunci când o linie de cache se schimbă, aceasta este imediat copiată înapoi în memoria cache L În timpul unui ciclu, memoria cache a datelor L poate efectua două citiri și o scriere „Voi folosi mai multe cache interne ( în cazul Podul de nisip) • Igiryitsgpiya se referă la diferite bănci, acestea pot fi efectuate simultan; і» în caz contrar, unul dintre apelurile către băncile aflate în conflict este inactiv II /in pentru cuvântul solicitat nu poate fi găsit în cache-ul de primul nivel, trimițând o cerere către cache-ul de al doilea nivel; acesta din urmă într-o astfel de situație fie răspunde la i riza, fie se referă la cache-ul general al celui de-al treilea nivel, după care răspunde II /breakdown, până la zece solicitări pot fi în stare de execuție în acest moment, direcționate din cache-ul de primul nivel către cache-ul de al doilea nivel Deoarece micro-operațiile sunt executate din secvența originală, • Salvarea în memoria cache a primului nivel este posibilă numai după resortarea re și 'imatele tuturor comenzilor care preced comanda de salvare Această sortare a rezultatelor cu urmărirea lor (ținând evidența unde sunt) ulii yul cinci stațiune bloc În cazul unei întreruperi, procesarea niciunuia dintre comenzile care nu au trecut încă de recurgerea rezultatelor nu se încetează; astfel se asigură respectarea cerinţei conform căreia, la întrerupere, trebuie Porc a finalizat toate comenzile până la un anumit punct din program Dacă comanda de salvare și-a resortat rezultatele, dar comenzile anterioare și următoare sunt încă în curs de procesare, rezultatele execuției lor sunt transferate în memoria tampon de comandă în așteptare deoarece memoria cache de prim nivel nu poate fi actualizată În acest buffer pot fi plasate până la de comenzi de salvare simultan Dacă una dintre comenzile de încărcare ulterioare încearcă să citească datele stocate, aceasta va fi redirecționată din bufferul de comandă în așteptare direct la comanda care nu este încă plasată în memoria cache de date de la primul nivel în acel moment Acest proces se numește redirecționare slorc-to-load Deși mecanismul de redirecționare poate părea elementar, în practică este destul de dificil de implementat - se poate dovedi că operațiunile de salvare în așteptare nu și-au calculat încă adresele În aia În acest caz, microarhitectura nu poate ști cu siguranță care dintre operațiunile de salvare va produce valoarea dorită Deci, este destul de evident că Core I are o microarhitectură complexă, a cărei soluție de proiectare este determinată de necesitatea de a sprijini setul de instrucțiuni Pentium moștenit pe un nucleu RISC modern cu un nivel ridicat de pipelining Acest obiectiv este atins prin împărțirea instrucțiunilor Pentiuin în micro-op-uri, memorarea lor în cache și trecerea lor (trei micro-op-uri odată) în conductă, unde sunt executate de mai multe ALU-uri care, în condiții optime, procesează până la șase micro-operații pe ciclu Micro-operațiile sunt executate cu o abatere de la secvența originală, dar returnează n și și sunt stocate în memoria cache a primului și al doilea nivel în ordinea specificată Microarhitectura Omap Sistemul TMAP cu un singur cip este dominat de două procesoare ARM Cortex A Cortex A este o microarhitectură de înaltă performanță implementarea setului de instrucțiuni ARM (versiunea ) Procesorul a fost proiectat de ARM Ltd; diversele sale modificări se găsesc într-o gamă largă de sisteme încorporate ARM nu produce procesorul, ci furnizează dezvoltările acestuia doar producătorilor de cipuri electronice care doresc să-l implementeze în sistemele lor cu un singur cip (în acest caz, Texas Instruments) Procesorul Cortex A este o mașină pe de biți cu registre de de biți și o cale de date pe de biți Busul de memorie, ca și arhitectura internă, este pe de biți Spre deosebire de Cortex i , procesorul Cortex A a fost conceput inițial ca un sistem RISC complet Prin urmare, nu a fost nevoie de un mecanism complex pentru convertirea vechilor comenzi CISC în micro-operații în acest caz Comenzile kernelului sunt micro-opțiuni gata făcute Cu toate acestea, în ultimii ani, au fost adăugate comenzi grafice și multimedia mai complexe care necesită dispozitive speciale pentru a fi executate Prezentare generală a microarhitecturii Cortex A Schema bloc a microarhitecturii Cortex A este prezentată în fig În general, este mult mai simplă decât microarhitectura Sandy Bridge utilizată în sistemele Cori i , ceea ce se explică prin complexitatea mai mică a arhitecturii setului de instrucțiuni Cu toate acestea, în unele componente de bază, pot fi urmărite asemănări cu Core i În primul rând, acest lucru se datorează factorilor tehnologici și economici De exemplu, ambele arhitecturi folosesc o ierarhie de stocare în cache pe niveluri pentru a îndeplini constrângerile stricte de cost ale aplicațiilor încorporate tipice; cu toate acestea, dimensiunea ultimului nivel al cache-ului Cortex A (L ) este de doar MB; în aceasta este semnificativ inferior procesorului Coge i , în care memoria cache de ultimul nivel (L ) poate ajunge la MB Diferențele se datorează în mare parte faptului că, în primul caz, dezvoltatorii au trebuit să ofere suport pentru setul moștenit de comenzi CISC, în timp ce în al doilea, o astfel de sarcină nu a fost stabilită În partea de sus a Fig Figura prezintă un cache de instrucțiuni asociative cu căi de K cu linii de de octeți Pentru că majoritatea echipelor exemple de niveluri microvrchitktursh b Inhalați predicția ramurilor/cache-ul adresei ramurilor Recursul Orez Diagrama structurală a microarhitecturii Cortex A a sistemului cu un singur cip OMAP La memoria LPDDR ARM ocupă octeți, în acest cache pot fi plasați aproximativ de Cymands în același timp - mult mai mult decât cache-ul micro-op Coge i Blocul de apel de instrucțiuni pregătește până la patru instrucțiuni pentru execuție per ciclu În cazul accesului nereușit la memoria cache a primului nivel, numărul de comenzi apelate este redus Când este detectată o ramură condiționată, se accesează un cache de adrese de salt cu o capacitate de de intrări; pe baza conținutului, se prevede prezența sau absența unei tranziții De asemenea, dacă preprocesorul detectează că programul rulează ȘI într-o buclă strânsă (o buclă mică care nu este imbricată), îl încarcă într-un cache special (cache de preluare paralelă pentru bucle rapide) Această optimizare accelerează preluarea instrucțiunilor și reduce consumul de energie, deoarece memoria cache și predictorii pot dormi în timpul unui ciclu dens Rezultatele blocului de apel de comandă sunt transmise decodoarelor, care decid ce resurse și datele de intrare vor avea nevoie comenzile Ca și în Cor I , codul de decodare este schimbat pentru a elimina conflictele WAR care pot încetini execuția cu resecvențiere După redenumire, comenzile sunt plasate în coada de distribuție a comenzilor, care le emite atunci când datele de intrare pentru blocurile funcționale sunt gata (eventual cu o modificare a secvenței) După cum se poate observa din fig , coada de distribuție a comenzilor trimite comenzi către blocurile funcționale Blocul de calcul întreg conține două ALU-uri ȘI o conductă scurtă pentru instrucțiuni de salt De asemenea, conține un fișier de registru fizic care conține registrele ISA și unele registre temporare Conducta Cortex A poate conține, de asemenea, unul sau mai multe nuclee de procesare care funcționează ca blocuri funcționale suplimentare ARM acceptă un nucleu de calcul VFP în virgulă mobilă și un nucleu cu numere întregi vectoriale SIMD numit NEON ilaaa -t /rivppv MICROARHITECTURILE Blocul de încărcare/salvare gestionează diferitele sarcini de încărcare și salvare Este asociat cu memoria cache de date și cu buffer-ul de salvare Cache-ul de date este de K de octeți și este un cache de date L cu căi cu linii de de octeți Bufferul de salvare conține comenzi de stocare X^M care nu și-au scris încă valorile în memoria cache a datelor stațiunii) Comanda de încărcare care este executată încearcă mai întâi să-și preia valoarea din buffer-ul de execuție, folosind un mecanism de redirecționare la încărcare similar cu mecanismul Core i corespunzător Dacă valoarea O^H nu este în memoria tampon de salvare, aceasta va fi preluată din memoria cache de date Într-unul dintre rezultatele posibile ale executării comenzii de încărcare, buffer-ul de salvare ordonă să aștepte, deoarece executarea comenzii este blocată de o operație de salvare timpurie cu o adresă necunoscută Dacă un acces la date L eșuează, blocul de memorie este preluat din memoria cache L grupată În unele circumstanțe, Cortex A efectuează, de asemenea, preluare la nivel hardware a datelor din memoria cache L în L pentru a ÎMBUNĂTĂȚI eficiența operațiunilor de încărcare și stocare L Cipul OMAP conține, de asemenea, logica de control al accesului la memorie Această logică este împărțită în două părți: interfața de sistem și controlerul de memorie Interfața sistemului interacționează cu memoria printr-o magistrală LPDDR pe de biți Toate cererile de memorie externă trec prin această interfață Magistrala LPDDR trimite o adresă de de biți pentru bănci, returnând un cuvânt de date de de biți Teoretic, cantitatea de memorie principală pentru fiecare canal LPDDR poate fi de până la GB ѲMAP are astfel de canale DVI, astfel încât sistemul este capabil să abordeze până la GB de memorie externă Controlerul de memorie convertește adresele virtuale de de biți în adrese fizice de de biți Cortex A acceptă memoria virtuală II (vezi capitolul ) cu o dimensiune a paginii de KB Pentru a accelera procesul de conversie, sunt furnizate tabele speciale numite Translation Lookaside Buffers (TLB) Ei compară adresa virtuală actuală cu adresele care au fost accesate în trecutul recent Transportor Cortex A în OMAR Conveior Cortex A din trepte; este prezentat într-o formă simplificată în Fig În partea stângă a figurii, pașii sunt indicați prin abrevieri Să luăm în considerare fiecare dintre ele separat Deschide treapta transportoare Fe (Fetch - fetch ) Folosește adresa următoarei instrucțiuni pentru a indexa memoria cache a instrucțiunilor și pentru a începe predicția ramurilor Această adresă urmează de obicei imediat următoarei instrucțiuni, dar secvența de execuție liniară poate fi întreruptă din diverse motive - să zicem, dacă instrucțiunea anterioară este un salt prezis, o capcană de excepție sau o întrerupere care trebuie gestionată Deoarece preluarea instrucțiunilor și predicția ramurilor durează mai mult de un ciclu, etapa Fe oferă timp suplimentar pentru a efectua aceste operații În etapa Fe , comenzile selectate (până la patru) sunt introduse în coada de comenzi ' ІuІІvIy Blocarea apelurilor de comandă G II Ceas de predicție de tranziție ІІІ ІІІ/ Nu ІН G- Hm/ -■m Hm WB Decodificarea comenzilor Înlocuirea comenzilor Orez Diagrama simplificată a conductei Cortex A în OMAP La pașii De (Decode ) și De , comenzile selectate sunt decodificate Etapele determină ce date de intrare vor avea nevoie instrucțiunile (registre și memorie) și ce resurse vor fi necesare pentru a le executa (blocuri funcționale) După finalizarea decodării, comenzile sunt transferate în etapa ( Re (Redenumire), în care are loc înlocuirea registrului pentru a elimina conflictele dintre WAR și WAW atunci când sunt executate cu o modificare a secvenței În această etapă, există un tabel de înlocuire cu informații despre ce registru fizic conține în prezent toate registrele arhitecturale Folosind acest tabel, puteți înlocui cu ușurință orice registru de intrare Registrelor de ieșire trebuie să li se acorde un nou registru fizic i lava * nivelul microarhitecturii un registru care este preluat din grupul de comenzi fizice neutilizate Registrul fizic alocat va fi folosit de comanda VPD pentru a-l completa În continuare, comenzile ajung în etapa Iss (Instruction Issue), în kotojx sunt plasate în coada de apeluri de comandă Coada de apeluri ține evidența ce | comenzile sunt gata pentru introducere Când este gata, scena primește date de registru (de la un fișier de registru fizic sau un bypass după care comanda se trece la etapele executive La fel ca C, Cortex A poate emite comenzi într-o ordine diferită de ordinea în care au fost scrise în program Pot fi emise până la patru comenzi pe ciclu, comenzi limitate de disponibilitatea blocurilor funcționale Execuția reală a instrucțiunii are loc în etapele Ex (Exec) Majoritatea instrucțiunilor aritmetice, logice și c folosesc ALU întregi și se completează într-un singur ciclu Încărcarea și stocarea durează două cicluri (când atingeți memoria cache L ), iar înmulțirea durează un ciclu Etapele Ex conțin mai multe blocuri funcționale: ALU pentru operații cu numere întregi ALU pentru operații cu numere întregi Bloc de multiplicare ALU pentru operații în virgulă mobilă și operații vectoriale SIMD (posibil, cu suport pentru VFP și NEON) Încărcarea și depozitarea blocurilor În prima etapă sunt procesate și instrucțiunile de ramificare condiționată, iar prezența/absența unei ramuri este determinată Dacă predicția este greșită, semnalul revine în treapta Fe și transportorul este anulat După finalizarea execuției, instrucțiunile intră în etapa WB (WriteBack), unde fiecare instrucțiune actualizează direct fișierul de registru fizic Teoretic, ulterior, când instrucțiunea este cea mai veche în curs de executare, aceasta își va scrie rezultatul registrului în fișierul registrului arhitectural Dacă apare o excepție sau o întrerupere, aceste valori devin vizibile, nu cele stocate în registrele fizice Actul de păstrare a cazului într-un fișier de arhitectură este echivalent cu recurgerea în Cor I În plus, în etapa WB, toate instrucțiunile de stocare își finalizează scrierea rezultatelor în memoria cache de date L Descrierea noastră a Cortex A nu este completă, dar oferă o idee despre cum funcționează și cum diferă de microarhitectura Cortex I Microarhitectura microcontrolerului ATmegal Diagrama de microarhitectură din ultimul nostru exemplu, Atmel ATmegal , este prezentată în Fig Este mult mai simplu decât microarhitecturile Coge i și OMAP Cert este că un cip destinat pieței încorporate trebuie să fie foarte mic și ieftin În consecință, scopul principal în proiectarea ATmegal a fost ieftinitatea, nu viteza După cum știți, „ieftin” și „simplu” sunt concepte foarte apropiate, în timp ce ieftinitatea și viteza în contextul nostru sunt rareori combinate Bus principal (V-bit) Orez Microarhitectura Atmel ATmegal Centrală pentru microarhitectura ATmegal este magistrala principală de biți Asociați cu acesta sunt registre și biți de stare, ALU-uri, memorie și dispozitive I/O Să le descriem acum pe scurt Fișier de înregistrare nc șindrilă de de registre de biți utilizate pentru stocarea datelor temporare Registrul de stare și registrul de control conțin semne ale celei de-a doua operațiuni a ALU (semn, overflow, negativitate, zero, carry), precum și bitul de întrerupere în așteptare Contorul programului conține adresa instrucțiunii în curs de executare Pentru a efectua o operație A /IU, trebuie mai întâi să citiți operanzii din registre și să-i transmiteți la ALU Ieșirea ALU este scrisă în orice registre inscriptibile prin magistrala principală ATmegal folosește mai multe tipuri de memorie pentru comenzi și date Mărimea memoriei magice de date este de KB, prea mult pentru a fi adresată complet de o adresă de biți pe magistrala principală Din acest motiv, arhitectura AVR permite construirea de adrese dintr-o pereche serială de registre H biți; rezultatul este o adresă de biți care acceptă până la KB de memorie de date EEPROM oferă până la KB de memorie nevolatilă în care programele pot scrie variabile care • supravieţuiesc unei posibile întreruperi de curent Există un mecanism similar pentru adresarea numelor de software, dar KB este prea mic pentru cod, chiar și în sistemele încorporate ieftine Pentru a aborda o memorie mai mare de instrucțiuni, arhitectura AVR va defini trei registre de pagină (RAMPX, RAMPY și RAMPZ), fiecare cu un dimensiune de biți Registrul de pagină este combinat cu o pereche de registru de biți pentru a forma o adresă de program de de biți, permițând adresarea a până la MB de spațiu de adrese de instrucțiuni Gândiți-vă pentru o secundă: KB de cod este prea puțin pentru un microcontroler care poate rula o jucărie sau un dispozitiv electronic mic În , IBM a lansat computerul System Model , care avea KB de memorie totală (nu poate fi extinsă) Computerul s-a vândut cu de dolari, ceea ce echivalează cu aproximativ două milioane la prețurile de astăzi ATmegal costă aproximativ USD — și mai puțin pentru un lot mare Dacă te uiți la prețurile avioanelor Boeing, este ușor de observat că acestea nu au scăzut de de ori în ultimii de ani Același lucru se poate spune despre mașini, televizoare și alte tehnologii - despre orice, cu excepția computerelor În plus, ATmegal include un controler de întrerupere la bord, interfață cu port serial (SPI) și temporizatoare necesare pentru aplicațiile în timp real Există, de asemenea, trei porturi I/O digitale pe biți, cu ajutorul cărora ATmegal poate controla până la de butoane externe, indicatoare, senzori etc Prezența temporizatoarelor și a porturilor de intrare/ieșire face posibilă utilizarea ATmegal în embedded sisteme cu microcircuite suplimentare Procesorul ATmegal aparține categoriei sincrone - majoritatea comenzilor pe care le procesează sunt finalizate într-un singur ciclu Procesorul are o arhitectură pipeline: în procesul de preluare a unei instrucțiuni, instrucțiunea anterioară este executată Cu toate acestea, conducta constă doar din două etape - preluare și execuție Pentru ca preluarea instrucțiunilor să aibă loc într-un singur ciclu, ciclul trebuie să permită citirea registrului din fișierul de registru, executarea instrucțiunii în ALU și apoi scrierea registrului înapoi în fișierul de registru Deoarece toate aceste operații au loc într-un singur ciclu, ocoliți sau nu este necesară logica de detectare a reținerii Comenzile programului sunt executate în ordine, într-un singur ciclu și fără suprapunere cu alte comenzi Dispozitivul ATmegal ar putea fi descris mai detaliat, cu toate acestea, descrierea disponibilă și circuitul prezentat în fig este suficient pentru a vă face o idee generală ATmegal are o magistrală principală (care reduce dimensiunea cipului), un set eterogen de registre și mai multe tipuri de memorie și dispozitive I/O conectate la magistrala principală În timpul fiecărui ciclu al căii de date, doi operanzi sunt citiți din fișierul de registru, trecuți prin ALU, iar rezultatele sunt din nou stocate în registre, la fel ca pe computerele mai moderne Comparație între procesoarele I , OMAP și ATteda Aceste trei procesoare diferă unul de celălalt în multe privințe, dar au o caracteristică surprinzătoare care poate ajuta la proiectarea unui computer Coge i acceptă un set de instrucțiuni CISC vechi pe care îl proiectează exemple la nivel de microarhitectură Ii Intel ar fi bucuros să fuzioneze în cel mai apropiat corp de apă, dar aceasta ar fi legislația lor necondiționată și de mediu OMAP este un set de instrucțiuni „pur” RISC-• eficient ATmegal este un simplu p de biți pentru sistemele încorporate În centrul tuturor exemplelor prezentate se află contoarele și una sau mai multe ALU-uri care efectuează operații aritmetice booleene simple cu operanzi din registre În ciuda diferențelor, Coge i și OMAP au funcționalități similare ale ambelor blocuri funcționale care primesc micro-operații, în care co-i este codul de operare și sunt specificate două registru de intrare și unul de ieșire rm efectua o micro-operație într-un ciclu Ambele sunt pipeline, predicție de ramuri și memorie cache partajată pentru unele date asemănarea internă nu este întâmplătoare, motivul pentru care nu este deloc tranziția inginerilor de la o companie din Silicon Valley la alta; da, am luat în considerare micro-arhitecturile Mіs- și Mіs- , am văzut că este exact ușor să construiți o cale de date canalizată cu două AI ca surse, în care valorile acestor registre sunt trecute prin ALU, iar rezultatul este stocat în registru Pe fig prezintă o imagine a unui astfel de transportor Pentru tehnologia modernă, acesta este un sistem eficient Principala diferență dintre Coge i și OMAP este modul în care comenzile H sunt transmise blocului funcțional Calculatorul Coge i trebuie să spargă instrucțiunile CIsc pentru a le converti în formatul cu registre cerut de CI al blocului funcțional Acest proces este prezentat în Fig - time-epms de comenzi mari în micro-operații mici OMAP nu trebuie să facă nimic, deoarece comenzile sale sursă sunt deja micro-opțiuni convenabile și compacte Acesta este motivul pentru care majoritatea noilor arhitecturi ISA sunt de tip RISC, care oferă combinația optimă de instrucțiuni Iibor și mecanismul intern de executare a acestora Este util să comparăm cea mai recentă dezvoltare a noastră, microarhitectura Mis- , cu aceste două mașini reale Mis- seamănă mai mult cu Coge i Ambele sisteme interpretează comenzi care nu sunt comenzi RISC Pentru a face acest lucru, ambele sisteme împart instrucțiunile în micro-operații, care indică codul de operare, două registru de intrare și unul de ieșire În ambele cazuri, micro-operațiunile sunt puse în coadă pentru execuții ulterioare În Міс- , micro-operațiunile sunt permise strict în ordine, executate strict în ordine și finalizate exact în aceeași ordine În Cohr i , micro-operațiunile sunt pornite în ordine, executate în ordine aleatorie și finalizate din nou în ordine Compararea Mis- și OMAP este incorectă, deoarece comenzile sistemului OMAP sunt comenzi RISC (adică micro-opțiuni cu registre) Ele nu trebuie să fie împărțite sau combinate Ele pot fi executate așa cum sunt, fiecare într-un ciclu de cale de date Dar, în comparație cu Coge i și TMAP , mașina ATmegal este foarte simplă Microarhitectura sa seamănă mai mult cu RISC decât cu CISC, deoarece instrucțiunile simple sunt executate într-un singur ciclu, fără a fi împărțite în părți componente Nu este prevăzută nici pipeline, nici cache Comenzile sunt executate, executate și returnează rezultatele în ordine În simplitatea sa, ATmegal seamănă cu Mis- ilvvn nivel de micro arhitectură Rezumatul capitolului n« în isіlano în fig , se situează între nivelurile microarhitecturii și „sistemul nerațional Din punct de vedere istoric, acest nivel s-a dezvoltat înaintea tuturor celorlalte niveluri și a fost inițial singurul Astăzi acest nivel • și ii adesea denumită „arhitectura” mașinii și uneori (incorect) cod de asamblare” Nivelul arhitecturii setului de instrucțiuni este de o importanță deosebită: este • іні іуіоіцм legătura între software și hardware Desigur, ar fi bine ca hardware-ul să ignore direct programele scrise în C, C++, Java sau alte limbaje de nivel înalt, dar aceasta nu este o idee bună Avantajul compilarii fata de interpretare s-ar pierde atunci În plus, computerele pur practice și iiibrlzhgpiy ar trebui să poată executa programe scrise în limbile іm ніі іх, și nu doar una Practic, toți designerii de sisteme cred că programele scrise în diferite limbi de nivel înalt ar trebui traduse în unele • Forma intermediară pentru toți — nivelul arhitecturii setului de instrucțiuni; Software-ul ipparatіios este orientat spre executarea directă a programelor la acest nivel Stratul de arhitectură a setului de instrucțiuni leagă compilatoare și hardware Este un limbaj pe care atât compilatorii, cât și dispozitivele îl înțeleg • pm Pe fig Figura arată relația dintre compilatoare, nivelul de arhitectură al lanțului de comenzi și hardware Programul FORTRAN Program în limbaj C Programul FORTRAN compilat ѵ în instrucțiunile mașinii Programul C compilat în instrucțiunile mașinii Nivelul arhitecturii set de instrucțiuni Software Un program din instrucțiunile mașinii este executat de firmware sau hardware Hardware Hardware Orez Stratul de arhitectură al setului de instrucțiuni este o legătură intermediară între compilatoare și hardware ilva o nivelul de arhitectură al comenzilor HBOOS În mod ideal, atunci când proiectează o nouă mașină, designerii de arhitectură CCM ar trebui să se consulte cu dezvoltatorii de compilatori și hardware pentru a determina ce caracteristici ar trebui să aibă stratul de sub jurisdicția lor Dacă dezvoltatorii compilatorului cer o proprietate pe care inginerii nu o pot implementa la un nivel acceptabil de cost (să zicem, un salt necondiționat cu un bonus pentru programator), atunci această idee va trece În același mod, dacă designerii de hardware doresc să adauge un nou element complicat la computer (de exemplu, memorie cu acces ultra-rapid la adrese care sunt numere prime dar programatorii nu vor putea scrie un program care să-l suporte, proiectul TLAM nu se va concretiza niciodată Implementarea end-to-end a nivelului de arhitect al setului de instrucțiuni, optimizat pentru limbajele de programare dorite, este întotdeauna produsul multor discuții și modelări Dar toate acestea sunt în teorie Acum să trecem la realitatea dură Când este anunțată o nouă mașină, prima întrebare pe care și-o pun toți potențialii scăldatori IW este: „Este mașina compatibilă cu retroactiv?” A doua întrebare este „Pot rula vechiul sistem de operare pe el?” Iar al treilea VM a întrebat: „Vor funcționa vechile aplicații pe această mașină și va necesita™ să fie înlocuite cu versiuni noi?” Dacă răspunsul la oricare dintre aceste întrebări este ok|| este numit negativ, dezvoltatorii vor trebui să facă argumente foarte convingătoare Este puțin probabil ca clienții să vrea să-și arunce programele preferate pentru a începe de la capăt Acest fapt îi obligă pe producătorii de computere să accepte același nivel de instrucție în diferite modele, sau cel puțin să-l facă reversibil Prin compatibilitate inversă, înțelegem capacitatea unei mașini noi de a rula programe vechi fără modificări În același timp, noua mașină poate accepta comenzi noi și poate avea alte caracteristici pe care le utilizează noul software Dezvoltatorii trebuie să facă nivelul de comandă compatibil cu înapoi, dar sunt liberi să schimbe hardware-ul după bunul plac, deoarece aproape niciunuia dintre cumpărători îi pasă de ce sunt cu adevărat „interiorurile” computerului și ce anume face acest sau acel dispozitiv Dezvoltatorii pot trece de la firmware la utilizarea directă a dispozitivelor, pot adăuga conducte, pot implementa circuite superscalare și așa mai departe, dar cu condiția ca acestea să rămână compatibili cu nivelul de instrucțiuni al modelelor anterioare Scopul principal este să vă asigurați că programele vechi funcționează pe noua mașină Adică, sarcina iese în prim-plan nu doar de a crea mașini bune, ci de a crea mașini bune, cu condiția să fie compatibile cu invers Toate cele de mai sus nu scad de la importanța stratului de arhitectură a setului de instrucțiuni Nivelul de calitate al arhitecturii setului de instrucțiuni este extrem de important, mai ales în ceea ce privește capacitățile de calcul și costul Performanța mașinilor echivalente cu diferite niveluri de arhitectură a seturilor de instrucțiuni poate diferi cu % Vrem doar să spunem că piața îngreunează într-o anumită măsură trecerea de la vechea arhitectură de echipă la cea nouă Cu toate acestea, uneori apar noi niveluri de comenzi de uz general și pe piețele specializate (de exemplu, pe piața pentru i nі іgm sau pe piața procesoarelor multimedia), ele apar mult mai des Nu vreau să spun, este important să înțelegeți cum funcționează acest strat Ce este o arhitectură de comandă bună? Există doi factori principali În primul rând, o arhitectură bună ar trebui să definească un set de instrucțiuni care pot fi implementate eficient nu numai în tehnologia modernă, ci și în tehnologia viitoare Cu o arhitectură de instrucțiuni prost proiectată, procesorul poate fi construit cu mai multe porți, mai multă memorie poate fi folosită pentru a executa programe etc Poate rula și mai lent, cu excepția cazului în care arhitectura setului de instrucțiuni ascunde posibilitatea executării paralele a operațiunilor și mai complexe sunt necesare scheme pentru a obține performanțe echivalente Un design care ține cont în mod corespunzător de dezavantajele unei anumite tehnici poate deveni baza pentru producția unei întregi linii de calculatoare, care poate fi înlocuită cu un sistem cu o arhitectură de instrucțiuni și mai ingenioasă În al doilea rând, o arhitectură de instrucțiuni bună ar trebui să ofere cunoștințele supreme despre care ar trebui să fie exact procesul compilat Claritatea și completitudinea opțiunilor sunt caracteristici care nu sunt întotdeauna caracteristice arhitecturii de comandă Aceste trăsături sunt deosebit de importante pentru un compilator care nu poate face cea mai bună alegere dintre mai multe alternative, în special în і і /і și unele alternative aparent evidente nu sunt acceptate de arhitectura de instrucțiuni Pe scurt, din moment ce stratul de arhitectură al setului de instrucțiuni este o legătură intermediară între arhitectura hardware și software, ar trebui să satisfacă atât dezvoltatorii hardware (în ceea ce privește implementarea eficientă), cât și programatorii (în ceea ce privește software-ul de generare de cod bun) Prezentare generală a nivelului arhitecturii setului de instrucțiuni Să începem studiul nostru asupra stratului arhitecturii setului de instrucțiuni întrebând ce este acesta Această întrebare la prima vedere poate părea simplă, dar de fapt există o mulțime de subtilități În următoarea subsecțiune, vom discuta unele dintre acestea și apoi vom analiza modelele de memorie, registru și instrucțiuni Set de instrucțiuni Proprietăți la nivel de arhitectură În principiu II, nivelul arhitecturii setului de instrucțiuni este nivelul la care computerul este prezentat programatorului care scrie programe la vârful mașinii Deoarece niciun programator normal nu scrie acum astfel de programe, am reelaborat ușor această definiție: un program la nivel de arhitectură de set de instrucțiuni este ceea ce compilatorul produce ca rezultat al lucrării (și deocamdată nu vom atinge apelurile de sistem și asamblatorul simbolic și de vârf) Pentru a obține un program la nivel de arhitectură de set de instrucțiuni, scriitorul compilatorului trebuie să știe ce model de memorie este utilizat w /rivѵn" comenzi ardit ѵkturvy WWtJQpi în mașină, ce registre, tipuri de date și instrucțiuni sunt disponibile Toate aceste informații împreună determină nivelul arhitecturii instrucțiunilor În conformitate cu această definiție, întrebările despre dacă arhitectura MIS este accesibilă programatic, dacă computerul este pipeline, superscalar etc , nu aparțin nivelului de arhitectură al setului de instrucțiuni, deoarece dezvoltatorul compilatorului nu vede toate acestea Cu toate acestea, această remarcă este doar parțial adevărată; unele dintre aceste caracteristici afectează debitul - un indicator care este destul de accesibil dezvoltatorului compilatorului Luați în considerare, de exemplu, o mașină superscalară care procesează instrucțiuni duble într-un ciclu și astfel încât o instrucțiune este un întreg întreg, iar a doua este un instrucțiune în virgulă mobilă Dacă instrucțiunile întregi și în virgulă mobilă sunt intercalate în codul rezultat din slave compilatorului, atunci performanța va crește considerabil Astfel, operația superscalară deNAM este disponibilă la nivelul de arhitectură a setului de instrucțiuni D, granițele dintre diferitele niveluri sunt neclare cic Pentru unele arhitecturi, nivelul de instruire este definit printr-un document formal, care este de obicei emis de un consorțiu industrial, dar pentru altele nu este De exemplu, ARM v (versiunea a ARM ISA) are o definiție oficială publicată de ARM Ltd Scopul unui astfel de document oficial este de a oferi posibilitatea diferiților producători de a produce mașini de acest tip, astfel încât mașinile VYa să poată executa aceleași programe și, în același timp, să primească SDS | si aceleasi rezultate j In cazul ARM, astfel de documente sunt necesare pentru a fi diferit! întreprinderile ar putea produce cipuri ARM identice, care diferă unele de altele doar prin performanță și preț Pentru ca această idee să funcționeze, vânzătorii de cipuri trebuie să știe ce face un cip ARM (la nivelul arhitecturii setului de instrucțiuni) Prin urmare, documentul vorbește despre ce este modelul de memorie, ce registre sunt disponibile, ce fac instrucțiunile etc , nu despre ce este microarhitectura Astfel de documente conțin secțiuni normative care stabilesc cerințele și secțiuni informative menite să ajute cititorul, dar nu fac parte din definiția formală În secțiunile normative, există în mod constant cuvinte care ar trebui, nu ar trebui, nu ar trebui, însemnând, respectiv, o cerință, o interdicție și o recomandare De exemplu, următoarea propoziție înseamnă că, dacă un program execută un cod operațional care nu este definit, OH ar trebui să provoace o capcană, nu doar să fie ignorat: Executarea unui cod operațional rezervat trebuie să declanșeze o capcană Poate exista o abordare alternativă: Rezultatul executării unui cod operațional rezervat este definit de implementare Aceasta înseamnă că designerul compilatorului nu se poate baza pe niciun comportament anume; prin urmare, dezvoltatorii au libertatea de a alege Descrierile arhitecturii sunt adesea însoțite de pachete de testare pentru a verifica dacă implementarea îndeplinește de fapt specificația Este foarte clar de ce ARM v vine cu un document care citește nivelul de arhitectură al setului de instrucțiuni care este necesar, astfel încât ambele cipuri ARM să poată rula aceleași programe De mulți ani, a existat documentul definitoriu І'irmіі'іyіоgo pentru arhitectura setului de instrucțiuni ІА- іn mKY) - Intel nu dorea ca alți producători să poată produce cipuri compatibile cu Intel Ea a făcut chiar apel la n și n să interzică producția de microcircuite de către alți producători, ♦іn a pierdut procesul Cu toate acestea, la sfârșitul anilor , Intel a publicat specificația ♦■♦ ІІ'іpuyu pentru setul de instrucțiuni IA- Fie că și-a dat seama de eroarea abordării sale și a vrut să-și ajute colegii designeri și programatori, a fost pentru că SUA, Japonia și Europa au decis să testeze Intel pentru legile monopolului O referință bine scrisă la setul de comenzi Intel este găsită și continuă să fie actualizată pe site-ul web Intel și dezvoltatori {http://developer intel com) Volumul versiunii cu comenzi Intel i nіg i este de de pagini; aceasta ne reamintește încă o dată că i » u i se referă la calculatoare cu un set de instrucțiuni complex O altă calitate importantă a nivelului arhitecturii setului de instrucțiuni este că cel puțin două moduri sunt acceptate pe majoritatea mașinilor Modul privilegiat II pornește sistemul de operare Acest mod nu va permite executarea tuturor comenzilor Modul utilizator este destinat programelor de aplicație huiu ka Nu permite executarea unor comenzi potențial periculoase (de exemplu, cele care manipulează direct memoria) În acest capitol, ne vom concentra în primul rând pe comenzile și funcțiile modului utilizator Modele de memorie Dar pe computerele iisx, memoria este împărțită în celule care au adrese consecutive În prezent, cea mai comună dimensiune a celulei este M mare, dar au fost utilizate anterior celule de la la de biți (a se vedea Tabelul ) O celulă și і K biți se numește octet (sau octet) Motivul pentru utilizarea celulelor de memorie de biți este că un caracter ASCII ia biți, deci niciunul (aveți cu un bit de paritate rar folosit) nu se potrivește într-un octet II alte codificări, cum ar fi Unicode și UTF- , folosesc grupuri de biți care sunt multipli de pentru a reprezenta simbolul Albii sunt de obicei grupați în cuvinte de octeți ( de biți) sau de octeți (biți II), iar instrucțiunile pentru manipularea cuvintelor întregi sunt prezente în set Multe arhitecturi necesită cuvinte pentru a se alinia pe propriile limite Astfel, un cuvânt de octeți poate începe la adresa , , etc , dar nu la adresa sau În mod similar, un cuvânt de octeți poate începe la adresa , sau , dar nu la adresa sau Mecanismul de alocare a і 'іov de octeţi în memorie este ilustrat în fig Alinierea adreselor este necesară destul de des, deoarece este cea mai eficientă modalitate de utilizare a memoriei De exemplu, un procesor Core I care apelează memorie de octeți prin interfața DDR acceptă numai accesări aliniate (ibit) Prin urmare, un Core I nu poate accesa deloc memoria nealiniată, deoarece interfața de memorie necesită ca adresele să fie un multiplu de Adresa octeți i ! i • • • II | іz f ț | - „Opt » opt O Cuvânt aliniat de octeți la adresa celulei A Adresa octeți І opt O Cuvânt nealiniat de octeți la adresa celulei Orez Locația cuvântului de octeți în memorie: cuvânt(e) aliniat(e); cuvânt nealiniat (b) Unele mașini necesită ca cuvintele să fie aliniate în memorie Cu toate acestea, cerința pentru alinierea adresei cauzează uneori unele probleme În procesorul Cope I , programele pot accesa fișiere începând de la orice adresă, o calitate care se întoarce la cu o magistrală de date de octet care nu necesita ca celulele să se afle pe granițele de octeți Dacă un program dintr-un procesor Core i citește un cuvânt de octeți de la adresa , hardware-ul trebuie să facă un acces de memorie* pentru a apela octeții de la la și un al doilea apel la octeții de la la Apoi CPU preia cei octeți necesari din citesc din memorie și le aranjează în ordinea corectă pentru a forma un cuvânt de octeți Este clar că executarea frecventă a unor astfel de operațiuni nu merge bine cu performanțe ridicate Capacitatea de a citi cuvinte cu adrese arbitrare necesită complexitatea cipului, care devine apoi mai mare și mai scump Dezvoltatorii ar fi bucuroși să scape de un astfel de cip și ar cere pur și simplu ca toate programele să acceseze memoria cuvânt cu cuvânt, nu octet cu octet Cu toate acestea, la întrebarea tradițională a dezvoltatorilor: „Cine are nevoie de programe vechi scrise pentru mașini și complet greșit cu memoria?” - urmează răspunsul nu mai puțin tradițional al vânzătorilor: „Către clienții noștri” Majoritatea mașinilor au un singur spațiu de adrese liniar care merge de la adresa la un maxim, de obicei sau de octeți Unele mașini au spații de adrese separate pentru instrucțiuni și date, astfel încât un apel de instrucțiuni la adresa și un apel de date la adresa se referă la spații de adrese diferite Un astfel de sistem este mult • -ishmnt decât un singur câmp de adresă, dar are două avantaje În primul rând, toate cu aceleași adrese de de biți, apare posibilitatea de NMі'іb octeți pentru programe și a altor de octeți pentru date În al doilea rând, „copiarea nm are loc întotdeauna automat numai în spațiul de date (și suprascrierea programului ivy devine imposibilă și, prin urmare, una dintre sursele erorilor software este, de asemenea, eliminată În cele din urmă, separarea datelor knііdі complică atacurile de programele rău intenționate pe care le pot schimba codul programului - nici măcar nu îl pot adresa (Rețineți că spațiile de adrese separate pentru instrucțiuni și date nu sunt aceleași cu un cache L partajat În primul caz, întregul spațiu de adrese este duplicat, iar citirea de la oricare adresă va produce rezultate diferite în funcție de ceea ce este citit exact: slo -іш /інн sau comandă Cu un cache împărțit, există un singur „і/і|іі” (fără * spațiu, doar diferite „іш ін din acest spațiu sunt stocate în blocuri cache diferite Un alt aspect al modelului memoriei este semantica memoriei Este firesc să ne așteptăm ca comanda LOAD, dacă este executată după comanda STORE, să meargă la acea adresă și să returneze valoarea doar stocată Totuși, așa cum am văzut în Capitolul , microinstrucțiunile sunt reordonate pe multe mașini Astfel, există un pericol real ca memoria să nu funcționeze așa cum este dată Situația devine mai complicată în prezența unui multiprocesor, când fiecare procesor trimite un flux de cereri de citire și scriere în memoria partajată, iar aceste iairos pot fi și reordonate Proiectanții de sistem au mai multe opțiuni pentru a rezolva această problemă Pe de o parte, toate cererile de memorie pot fi ordonate în așa fel încât fiecare să fie finalizată înainte de a începe următoarea Această strategie are un efect negativ asupra performanței, dar va oferi cea mai simplă semantică a memoriei (toate operațiunile sunt efectuate strict în ordinea în care sunt localizate în program) (Pe de altă parte, nu puteți face deloc garanții cu privire la ordonarea solicitărilor de memorie, iar pentru a realiza o astfel de ordonare, programul execută comanda SYNC, care blochează lansarea tuturor operațiunilor noi de memorie până la finalizarea celor anterioare Aceasta ideea este foarte dificilă Dezvoltatorii de compilatori trebuie să muncească din greu pentru că trebuie să înțeleagă cu atenție cum funcționează microarhitectura corespunzătoare, dar dezvoltatorilor de hardware li se oferă libertate deplină în ceea ce privește optimizarea utilizării memoriei Sunt posibile și modele de memorie intermediară, în care hardware-ul blochează automat începerea anumitor operațiuni de memorie (de exemplu, cele asociate cu interdependențe RAW și WAR), fără a bloca în același timp începerea tuturor celorlalte operațiuni Deși implementarea acestor caracteristici la nivelul arhitecturii setului de instrucțiuni este destul de plictisitoare (cel puțin pentru scriitorii de compilatori și programatorii de limbaje de asamblare), există acum o tendință notabilă către prevalența acestei abordări Această tendință este stimulată de dezvoltări precum mecanismele de reordonare a microinstrucțiunilor, conductele, cache-urile pe mai multe niveluri și așa mai departe Alte exemple mai puțin cunoscute de acest gen vor fi discutate mai târziu în acest capitol Registrele Toate calculatoarele au mai multe registre disponibile la nivelul d|i al arhitecturii setului de instrucțiuni Acestea vă permit să controlați execuția programului, să stocați rezultate temporare și sunt, de asemenea, utilizate în alte scopuri De obicei, registrele disponibile la nivel de microarhitectură (cum ar fi TOS și MAR în Figura ) nu sunt disponibile la nivelul arhitecturii setului de instrucțiuni, dar registre precum contorul de program și pointerul de stivă sunt disponibile la ambele niveluri În același timp, registrele accesibile la nivelul arhitecturii setului de comenzi sunt întotdeauna disponibile la nivel de microarhitectură, deoarece acolo sunt rgnizate Registrele de nivel de arhitectură setului de instrucțiuni pot fi împărțite în două categorii: registre speciale și registre de uz general Registrele speciale includ contorul de programe și indicatorul de stivă, precum și alte registre care au funcții speciale Registrele de uz general conțin chei, variabile locale și rezultate intermediare ale calculelor Funcția lor principală este de a oferi acces rapid la datele utilizate frecvent (de obicei fără acces la memorie) Mașinile RISC cu procesoare rapide și memorie (relativ) lentă conțin de obicei cel puțin de registre de uz general, numărul de registre de uz general crescând constant la procesoarele mai noi În unele mașini, registrele de uz general sunt complet simetrice și interschimbabile Dacă toate registrele sunt echivalente, compilatorul poate folosi atât registrul R , cât și registrul R pentru a stoca rezultatul intermediar Alegerea registrului nu contează Pe alte mașini, unele registre de uz general pot fi specializate De exemplu, procesorul Core i are un registru EDX care poate fi folosit ca registru de uz general, dar care, în plus, este folosit pentru a rezolva probleme foarte specifice (ia jumătate din produs la înmulțire și jumătate din dividend la împărțire) Chiar dacă registrele de uz general sunt complet interschimbabile, sistemul de operare sau compilatoarele urmează adesea convenții formale pentru utilizarea lor De exemplu, unele registre pot fi folosite pentru a stoca parametrii procedurilor apelate, în timp ce altele sunt temporare Dacă compilatorul plasează o variabilă locală importantă în registrul R și apoi apelează o procedură de bibliotecă care tratează R ca pe o procedură alocată temporar în registru R poate rămâne „gunoi” Adică dacă exist! orice convenție de sistem pentru utilizarea registrelor trebuie să fie urmată de scriitorii de compilatori și programatorii de asamblare Pe lângă registrele disponibile la nivelul arhitecturii setului de instrucțiuni, există întotdeauna destul de puține registre speciale disponibile doar în modul privilegiat Aceste registre controlează diverse blocuri cache, memoria principală, dispozitivele I/O și alte dispozitive ale mașinii Aceste registre sunt utilizate numai de sistemul de operare, astfel încât compilatorii și utilizatorii nu trebuie să știe despre existența lor, Și/uni Registrul „hibrid” este disponibil atât în modul privilegiat, cât și în modul zero Acesta este registrul PSW (Program State Word), care se mai numește și registrul flag Registrul flag conține diferiții biți necesari CPU Cei mai importanți biți sunt biții condiționali Ele sunt setate în fiecare ciclu ALU și reflectă starea operației anterioare: ♦ N rezultat este negativ (Negativ); ♦ / rezultatul este (Zero); ♦ Rezultatul V a provocat un overflow (oVerflow); ♦ (' purta bitul din stânga (efectuează); ♦ A carry bit (Auxiliary carry); Rezultatul R este par (Paritate) Codurile de condiție sunt foarte importante deoarece sunt folosite în comparații și salturi condiționate De exemplu, instrucțiunea CMP scade de obicei un operand din altul și stabilește coduri de condiție pe baza diferenței Dacă operanzii sunt în regiune, atunci diferența va fi egală cu , iar bitul Z va fi setat în registrul steag Următoarea instrucțiune BEQ (Branch Equal - branch in case of equality) pro-ngează bitul Z și ia ramura daca este setata Un registru mat poate stoca mai mult decât coduri de stare Conținutul său și mașinile de sacristie pot fi diferite Câmpurile suplimentare indică modul (de exemplu, utilizator sau privilegiat), bit de urmărire (care este utilizat pentru depanare), nivelul de prioritate a procesorului, starea întreruperii Registrul steag este de obicei citit în pi'*pm(') al utilizatorului, dar unele câmpuri pot fi scrise doar în pi'*pm(' privilegiat (de exemplu, bitul care specifică modul) Echipe Cea mai mare caracteristică a nivelului pe care îl luăm în considerare acum este setul de instrucțiuni ale mașinii Ei controlează acțiunile mașinii În acest set, există întotdeauna, în mii sau într-o altă formă, comenzile LOAD și STORE, destinate mutarii datelor între memorie și registre, și comanda MOVE, care este străină pentru copierea datelor dintr-un registru în altul De asemenea, întotdeauna cu -і ѵг MOV R ,# ; R = prima valoare a indicelui inutil MOV R ,A(R ) ȘI R ,B(R ) SAU R ,R ADAUGĂ R ,# CMP R ,R BLT LOOP ; R = A[i] ; R = A[i] ȘI B[i] ; i = i + ; ar trebui sa continui? ; dacă R tratarea cazului n (de exemplu, verificând ce valoare * este atribuită lui n ), el poate folosi codul mai eficient prezentat în Lista Cândva, standardul de limbaj FORTRAN cerea ca toate buclele să fie executate cel puțin o dată Acest lucru ne-a permis să generăm întotdeauna cod mai eficient (ca în Listarea ) În , acest defect a fost remediat, deoarece până și adepții FORTRAN au început să realizeze că era prea bine să aibă o declarație de buclă cu o semantică atât de ciudată, deși nu a salvat o instrucțiune de salt pe buclă În C și Java, abordarea normală a fost folosită de atunci comenzi I/O Și un alt grup de instrucțiuni nu variază la fel de mult între mașini precum instrucțiunile I/O Calculatoarele personale moderne folosesc trei scheme I/O diferite: + I/O programabil cu așteptare activă; + intrare-ieșire cu control întrerupere; + I/O cu acces direct la memorie Vom analiza pe rând fiecare dintre aceste scheme Cea mai simplă metodă I/O este I/O programabilă Această schemă este adesea folosită în microprocesoarele ieftine, de exemplu, sistemele încorporate sau în sistemele care trebuie să răspundă rapid la schimbări externe (sisteme în timp real) Astfel de profesioniști au de obicei o comandă de intrare și o comandă de ieșire Fiecare dintre comenzile lor selectează unul dintre dispozitivele I/O Între procesorul fix și dispozitivul I/O selectat este transmis unui alt personaj Procesorul trebuie să execute un anumit număr de instrucțiuni de fiecare dată când citește și scrie un caracter Ca exemplu, luați în considerare un terminal cu patru registre de octet, așa cum se arată în Fig Pentru intrare sunt utilizate două registre: registrul de intrare al dispozitivului și registrul de date Două registre sunt utilizate pentru a scoate atât registrul de stare a dispozitivului, cât și registrul de date Fiecare dintre ele are o adresă unică Dacă există I/O mapate în memorie, registrele Int fac parte din spațiul de adrese și pot fi citite și scrise folosind instrucțiunile normale de memorie În caz contrar, citirea și scrierea registrelor necesită comenzi speciale I/O, cum ar fi IN și OUT În ambele cazuri, I/O nguice( se realizează prin transferul de date și informații despre starea dispozitivului între CPU și registrele specificate Bit de prezență a caracterului tampon Gata de a primi bit următorul personaj Simbol primit Buffer de tastatură Buffer de afișare Simbol de afișare Orez Dispozitivul se înregistrează într-un terminal simplu Sunt utilizați doar doi din cei opt biți din Registrul de stare a tastaturii (Bitul din stânga este setat de hardware ori de câte ori apare un caracter în buffer-ul tastaturii Dacă bitul a fost setat anterior de software, se execută o întrerupere În caz contrar, nu are loc nicio întrerupere (întreruperile vor fi discutate mai jos) În I/O programabile, În mod normal, procesorul central citește periodic registrul de stare a tastaturii într-o buclă până când bitul este setat la Când se întâmplă acest lucru, registrul tampon al tastaturii este citit în software pentru a obține un caracter Concluzia se face într-un mod similar Pentru a afișa un caracter pe ecran, registrul de stare de afișare este mai întâi citit de software pentru a vedea dacă bitul de pregătire este setat Dacă nu este setat, bucla este executată din nou și din nou până când bitul gata devine unul Aceasta va indica faptul că dispozitivul este pregătit să accepte caracterul Odată ce terminalul este în starea de pregătire, caracterul este scris în registrul tampon al afișajului în software, care afișează caracterul pe ecran și indică dispozitivului să ștergă bitul pregătit din registrul de stare a afișajului Când un caracter apare pe ecran și terminalul se pregătește să proceseze următorul caracter, controlerul setează din nou bitul gata Ca exemplu de I/O programabil, luați în considerare procedura Java (Listarea ) Această procedură este apelată cu doi parametri: o matrice urale* pviira comenzi caractere care urmează să fie scoase și numărul de caractere disponibile dintr-o privire (până la un kilobit) Corpul procedurii este o buclă care introduce câte un caracter pe rând În primul rând, CPU așteaptă ca dispozitivul să fie gata și abia apoi scoate un caracter, iar această secvență de acțiuni se repetă pentru fiecare caracter Procedurile ip și out sunt rutine tipice de asamblare pentru citirea și scrierea registrelor dispozitivului, care sunt definite de primul parametru Variabila din care este citită sau scrisă este determinată de cel de-al doilea parametru Împărțirea la (prin deplasarea la dreapta cu biți) elimină cei biți inferiori, lăsând bitul gata la bitul zero Lista Exemplu I/O programabil public static void output buffer(int buf[], int count) { // Ieșire bloc de date către dispozitiv int status, i, ready; pentru (i = ; i > ) & x ; // selectează bit // gata } în timp ce (gata == ); out(display buffer reg, buf[i]); } } Principalul dezavantaj al I/O programabile este că procesorul își petrece cea mai mare parte a timpului într-o buclă așteptând ca dispozitivul să fie gata Acest proces se numește așteptare activă Dacă procesorul nu trebuie să facă altceva (ca într-o mașină de spălat, de exemplu), nu este nimic de care să vă faceți griji (deși chiar și un simplu controler trebuie adesea să controleze mai multe procese paralele) Dar dacă procesorul trebuie să efectueze alte acțiuni, de exemplu, pornirea altor programe, atunci așteptarea activă nu este potrivită aici și trebuie să căutați alte metode I/O Pentru a scăpa de așteptarea activă, este necesar ca procesorul central să pornească un dispozitiv I/O, iar acest dispozitiv, după finalizarea activității, raportează acest lucru procesorului folosind o întrerupere Uită-te la fig Prin setarea bitului de activare a întreruperii în registrul dispozitivului, programul spune că așteaptă un semnal de la hardware despre finalizarea dispozitivului I/O Ne vom uita la întreruperi mai detaliat mai târziu în acest capitol când vom ajunge la problemele legate de transferul de control În multe computere, semnalul de întrerupere este generat prin înmulțirea logică (ȘI) a bitului de activare a întreruperii și a bitului de pregătire a dispozitivului Dacă activați programatic întreruperile în primul rând (înainte de a porni dispozitivul I/O), întreruperea va apărea imediat deoarece bitul de pregătire este deja setat Adică, probabil că mai întâi trebuie să porniți dispozitivul și numai după aceea să activați întreruperile Scrierea unui octet în registrul de stare a dispozitivului nu schimbă bitul gata, care poate fi doar citit Niod-out condus de întreruperi este un mare pas înainte în caracterul i (sâsâit cu intrare-ieșire programabilă, dar încă departe de a fi perfect Faptul este că trebuie generată o întrerupere pentru fiecare npnigmop) caracter și ai nevoie de ceva, apoi scăpați de prea multă întrerupere Soluția constă în revenirea la I/O programabil, deoarece numai altcineva ar trebui să facă această lucrare în locul procesorului central Uită-te la fig Am adăugat un nou cip - un controler de acces direct la memorie (DMA), care are acces direct la magistrală Terminal Obosi Orez Sistem cu controler de acces direct la memorie Cipul DMA are cel puțin registre Toate pot fi încărcate programatic de procesorul central Primul registru conține adresa de memorie care trebuie citită sau scrisă Al doilea registru conține numărul de octeți sau cuvinte care trebuie transferate Al treilea registru conține numărul sau adresa dispozitivului I/O în spațiul de adrese I/O, specificând dispozitivul dorit Al patrulea registru spune dacă datele ar trebui citite sau scrise pe dispozitiv Pentru a scrie un bloc de de octeți din adresa de memorie la un terminal (de exemplu, dispozitivul ), CPU scrie numerele , și în primele trei registre ale DMA și codul de scriere (de exemplu, ) în al patrulea registru, așa cum se arată în fig Controlerul DMA, inițializat în acest fel, face o cerere de acces la magistrală pentru a citi octetul din memorie, exact ca și când acel octet ar fi fost citit de CPU După ce a primit octetul necesar, controlerul DMA trimite o solicitare I/O către dispozitivul pentru a-i scrie un octet După finalizarea acestor două operații, controlerul DMA crește registrul de adrese cu și decrește registrul contorului cu Dacă contorul rămâne pozitiv, următorul octet este citit din memorie și scris pe dispozitivul I/O w /HwBono Argumente pentru comenzi Când contorul ajunge la , controlerul IDI oprește transferul de date și încarcă linia de întrerupere pe cipul procesorului Cu IDN, CPU-ul trebuie doar să inițializeze câteva registre, după care poate face altceva până la finalizarea transferului de date Când transferul este finalizat, CPU primește un semnal de întrerupere de la controlerul IDN Unele controlere IDI conțin , sau mai multe seturi de registre, astfel încât să poată controla mai multe procese de transfer în același timp Rețineți că, dacă un dispozitiv de mare viteză, cum ar fi un disc, va fi rulat de un controler IDN, vor fi necesare o mulțime de vârfuri de ciclon atât pentru accesul la memorie, cât și pentru accesul la dispozitiv În timpul acestor cicluri, procesorul va trebui să aștepte (controlerul IDI are întotdeauna prioritate față de procesor pentru accesul la magistrală, deoarece dispozitivele I/O de obicei nu permit întârzieri) - acest proces se numește captarea ciclului de memorie Cu toate acestea, suprasarcina asociată cu ciclurile de captare nu este nimic în comparație cu economiile obținute prin faptul că nu trebuie să procesați o întrerupere pentru fiecare transfer de octeți (cuvânt) Instrucțiuni procesor COGE I În aceasta și în următoarele două subsecțiuni, ne vom uita la seturile de instrucțiuni ale trei mașini: Cor i , OMAP ARM și ATmegal AVR Fiecare dintre ele acceptă comenzi de bază care sunt obținute de obicei ca urmare a muncii compilatorilor, precum și * comenzi suplimentare care sunt rareori utilizate sau utilizate exclusiv de sistemul de operare Să începem cu Coge i , cel mai complex set de instrucțiuni În comparație cu el, toți ceilalți arată simpli Instrucțiunile COGE i sunt un amestec bizar de instrucțiuni pe de biți, precum și instrucțiuni care au apărut în procesorul prezintă cele mai comune comenzi întregi, folosind următoarea notație: + SRC — sursa de date; + DST - receptor de date; + # este numărul de biți cu care are loc deplasarea; + LV este numărul de variabile locale Tabelul Cele mai comune comenzi întregi ale procesorului Coge i Descrierea comenzii Comenzi de mișcare MOV DST, SRC Mută de la SRC la DST PUSH SRC Împingeți SRC pe stivă POP DST Scoaterea unui cuvânt din stivă și plasarea lui în DST XCHG DS , DS Schimbați scaunele DS și DS LE A DST SRC Încărcați adresa SRC validă în DST ( MOV DST, SRC Mișcare condiționată Tipuri de comenzi ^Yanda Descriere comenzi schfmetice ■Dl) DST, SRC Adăugarea SRC și DST ■UB DST, SRC Scădeți SRC din DST ^ Ul SRC Înmulțiți EAX cu SRC (fără semn) Kui SRC Înmulțiți EAX cu SRC (supus semnării) Biv SRC Împărțiți EDX:EAX la SRC (fără semn) YV SRC Împărțiți EDX:EAX la SRC (sensibil la semn) gDC DST, SRC Adăugați SRC la DST și adăugați un bit de transport GSM DST, SRC DST scădere și transfer din SRC foc DST Increment (adăugați ) DST [DEC DST Scădere (scădeți ) DST ( Rec dst Negate DST (scădeți DST de la ) Comenzi binare zecimale l)AA Corecție zecimală DAS Corecție zecimală pentru scădere TOATE corecția ASCII pentru adăugare Corecție AAS ASCII pentru scădere ALM corectare cod ASCII pentru multiplicare Corecție AAD ASCII pentru divizare Comenzi logice ANI) DST, SRC Operare logică și pe SRC și DST OR DST, SRC Operație logică OR pe SRC și DST XOR DST, SRC logic EXCLUSIV OR operare pe SRC și DST NU complementul DST înlocuirea DST Comenzi de schimbare obișnuite și ciclice SAL/SAR DST, # Shift DST stânga/dreapta cu # biți SIIL/SHR DST, # Deplasare logică DST la stânga/dreapta cu # biți ROL/ROR DST, # Rotiți DST la stânga/dreapta cu # biți RCL/RCR DST, # Rotiți DST cu # de biți de transport Comenzi de testare și comparare TST SRC , SRC operanzi booleeni AND, setarea steaguri CMP SRC , SRC Setați steaguri pe baza diferenței dintre SRC și SRC Comenzile de transfer de control JMPADDR Salt la adresa |хх ADDR Salturi condiționate bazate pe steaguri continuare & Capitolul Stratul de arhitectură al setului de instrucțiuni Tabelul (continuare) Descrierea comenzii CALL ADDR Procedura de apel la adresa RET Procedura de ieșire RET Ieșire întrerupere RC LOOPxx Continuarea buclei până când este îndeplinită o anumită condiție ' SAU NT ADDR întrerupere software INTO Întreruperea dacă bitul de depășire este setat, Y Comenzi de procesare a șirurilor D] LODS șirul de încărcare J STOS Salvare linie MOVS Mută o linie CMPS Compara două șiruri l SCAS Scanare linie Comenzi de cod de condiție STC Setați bitul de transport în registrul EFLAGS CLC Șterge bitul de transport din registrul EFLAGS CMC Complementarea bitului de transport din registrul EFLAGS STD Setați bitul de direcție în registrul EFLAGS CLD Șterge bit de direcție în registrul EFLAGS STI Setați bitul de întrerupere în registrul EFLAGS CLI Ștergeți bitul de întrerupere din registrul EFLAGS PUSHFD Împingeți valoarea din registrul EFLAGS în stivă POPFD Introduceți o valoare din stivă în registrul EFLAGS LAHF Încărcare AH din registrul EFLAGS SAHF Conservarea AH în registrul EFLAGS Alte comenzi SWAP DST Schimbați ordinea octeților în DST CWQ Extinderea EAX la EDX:EAX pentru divizie Extensie CWDE a unui număr de biți din AX la EAX ENTER SIZE, LV Creați un cadru stivă cu dimensiunea octeților LEAVE Şterge cadrul stivei creat de comanda ENTER NOP Operare gol Oprire HLT IN AL, PORT Transfer octet de la port la ALU OUT PORT, AL Transfer octet de la ALU la port Așteptați o întrerupere Tipuri de comandă Lista este departe de a fi completă, deoarece nu include comenzi flotante, comenzi de control, precum și unele comenzi mici care apar rar (de exemplu, utilizarea unui octet de biți pentru a selecta o căutare într-un tabel) Cu toate acestea, tabelul oferă o idee despre ce acțiuni poate efectua Coge i și nicio instrucțiune Core i nu se referă la unul sau doi operanzi care se află în registre sau memorie De exemplu, instrucțiunea binară ADD adaugă un rand, iar instrucțiunea unară INC crește valoarea unui operand cu • Unele instrucțiuni au mai multe variante similare De exemplu, comenzile pot deplasa un cuvânt fie la dreapta, fie la stânga, ținând cont de bitul de semn și de contabilitate Majoritatea instrucțiunilor au mai multe codificări diferite datorită naturii operanzilor Când comenzile sunt executate, sursele de date (SRC) nu se schimbă, dar de obicei IIKI de recepție (DST) se schimbă Există anumite reguli care determină ce poate fi o sursă și ce poate fi o chiuvetă; sunt oarecum haotici ^Se schimbă de la echipă la echipă, dar despre ei nu vom vorbi aici Multe IUMapd-uri au trei opțiuni: pentru operanzi de biți, biți și, respectiv, de biți Ele diferă în opcode și/sau un bit per instrucțiune fila L arată în principal instrucțiuni pe de biți Pentru comoditate, am împărțit comenzile în mai multe grupuri Primul grup conține instrucțiuni care mută date între componentele aparatului: registre, memorie și stivă Al doilea grup conține comenzi aritmetice pentru operații semnate și nesemnate La înmulțire și împărțire, produsul sau dividendul pe de biți este stocat în două registre: EAX (biți mai mici) și ІіІ)X (biți mai mari) Al treilea grup include aritmetica binar-zecimală Aici, fiecare Nm este tratat ca doi nibbles de biți Fiecare ciugulă conține o zecimală (de la la ) Sunt utilizate combinații de biți de la la Astfel, un număr întreg de biți poate conține un număr zecimal între și Deși această formă de stocare este ineficientă, elimină nevoia de a converti intrarea zecimală în binar și apoi înapoi la zecimal pentru ieșire Aceste comenzi sunt folosite pentru a efectua operații aritmetice pe numere BCD Sunt utilizate pe scară largă în programele COBOL Instrucțiunile logice și de schimbare manipulează biții dintr-un cuvânt sau octet în mai multe combinații posibile Următoarele două grupuri sunt legate de verificarea, compararea și implementarea tranziției în funcție de rezultat Rezultatele testului și comparației sunt stocate în diferiți biți în registrul EFLAGS Simbolurile Jxr denotă un grup de instrucțiuni care efectuează o ramură condiționată în funcție de rezultatele comparației anterioare (adică în funcție de biții din registrul EFLAGS) Coge i acceptă mai multe comenzi pentru încărcarea, salvarea, mutarea, compararea și scanarea șirurilor de caractere sau cuvinte Aceste comenzi pot fi precedate de un octet de prefix special REP (repetiție - repetiție), care face ca comanda să fie repetată până când este îndeplinită o anumită condiție (de exemplu, până când registrul ECX, a cărui valoare scade cu după fiecare repetare, devine egal) la ) Acțiuni atât de diferite ilva o stratul arhitecturii setului de instrucțiuni (deplasare, comparare etc ) poate fi efectuată pe blocuri arbitrare de date ||M Următorul grup de comenzi controlează codurile de stare Ultima grupă include echipe care nu sunt incluse în niciuna dintre grupele anterioare Acestea sunt comenzi pentru transcodare, managementul stivei de cadre, I/O și oprirea procesorului L Comenzile Core I au un număr de prefixe Unul dintre ele (REP) am REDUCUT deja zerouri Un prefix este un octet special care poate fi plasat practic înaintea oricărei comenzi (asemănător cu wide în el) După cum sa menționat deja, prefixul MH face ca instrucțiunea care o urmează să fie repetată până când registrul BON este setat la Prefixele REPZ și REPNZ fac ca instrucțiunea să fie executată din nou și din nou până când codul de execuție a condiției Z ia valoarea sau QI în mod responsabil Prefixul LOCK rezervă magistrala pentru întreaga instrucțiune, astfel încât MOLITZ să poată gestiona sincronizarea interprocesor Alte prefixe „FOLOSIT” sunt folosite pentru a face comanda să funcționeze în format de sau de biți ÎNAINTE, aceasta nu numai că schimbă lungimea operanzilor, dar redefinește complet^! moduri de adresare În cele din urmă, Cori implementează o schemă de segmentare complexă care implică cod, date, stivă și segmente suplimentare (vehicul ) Prefixele vă permit să reglați utilizarea anumitor segmente atunci când accesați memorie Din fericire, această problemă este prea urgentă pentru noi, SF comenzi OMAR Aproape toate instrucțiunile ARM întregi în modul utilizator care pot fi generate de compilator sunt enumerate în Tabelul , se utilizează următoarea notație: + S — registru sursă; + S IMM - sursa (registru sau direct date); + S - registru sursă (când se utilizează trei registre); + DST - registru receptor; + DST — registru receptor ( sau ); + DST - registru receptor ( sau ); + ADDR - adresa de memorie; + IMM - valoare imediată; + REGLIST - lista registrelor; + PSR - registru stare procesor; + ss — condiție de tranziție Tabelul Comenzi de bază ale procesorului OMAP Descrierea comenzii Descărcați Comenzi LDRSB DST, ADDR Încărcare octet semnat ( biți) LDRB DST, ADDR Încarcă octet nesemnat ( biți) LDRSH DST, ADDR Încarcă jumătate de cuvânt semnat ( biți) Iѵmanda Descriere DHIÎ DST ADDR Încarcă jumătate de cuvânt nesemnat ( biți) PC DST, cuvânt de încărcare ADDR ( de biți) DM St, REGLIST Se încarcă câteva cuvinte Salvare începe VI HB DST, ADDR Stocare octet ( biți) URII DST, ADDR Stocare jumătate de cuvânt ( biți) STR DST, ADDR Stocare cuvânt ( de biți) NTM SRC, REGLIST Salvați mai multe cuvinte Comenzi aritmetice ADAUGĂ DST, SI, S IMM ADD DST, SI, S IMM Adăugați, transportați NUB DST, SI, S IMM Scădere SUB DST, SI, S TMM Purtare scădere USB DST, SI, S IMM Scădere inversă USC DST, SI, S IMM Scădere inversă cu transport MUL DST, SI, S Multiplicare Ml A DST, SI, S , S Înmulțirea cu acumulare UMULLD , D , SI, S Înmulțire lungă fără semn SMULL Dl, D , SI, S Înmulțire lungă semnată UMLAL Dl, D , SI, S Înmulțire lungă fără semn SMULL Dl, D , SI, S Înmulțire lungă semnată cu acumulare (MP SI, S IMM Comparație cu configurarea PSR Comenzi de schimbare obișnuite și ciclice I SL DST, SI, S IMM Deplasare logică la stânga LSR DST, SI, S IMM Deplasare logică la stânga ASR DST, SI, S IMM Deplasare logică la dreapta l«)R DSR, SI, S IMM Deplasare logica la dreapta Comenzi logice TST DST, SI, S IMM Verificare biți TEQ DST, SI, S IMM Verificare egalitate AND DST, SI, S IMM Logic AND EOR DST, SI, S IMM XOR logic ORR DST, SI, S IMM OR logic BIC DST, SI, S IMM Resetare biți continuare & ilyaia o nivel de arhitectură a buclei de instrucțiuni Tabelul (continuare) Comanda Descriere HJ Comenzile de transfer de control Greutatea IMM Salt la adresa PC+IMM BLcc IMM Tranziție cu comunicare la adresa RS+IMM BLcc SI Tranziție cu link către adresa stocată în registru Alte comenzi MOV DST, SI MOVT DST, IMM Mută IMM în MSB MVN DST, SI inversare registru MRS DST, PSR Citiți PSR MSR PSR, SI Record PSR SWP DST SI, ADDR Registru de memorie/permutare cuvânt SWPb DST, SI, ADDR Registru de memorie/permutare octet SWI IMM întrerupere software Tabelul nu include comenzi în virgulă mobilă, comenzi de control (de exemplu, comenzi de memorie cache, comenzi de repornire a sistemului), comenzi care implică spații de adrese non-utilizator, comenzi învechite Setul de instrucțiuni este surprinzător de mic Acest lucru este de înțeles, deoarece OMAP este un procesor RISC Structura comenzilor LDR și STR este foarte simplă Aceste comenzi au opțiuni pentru , și octeți Dacă un număr mai mic de de biți este încărcat într-un registru ( de biți), numărul poate fi fie extins prin semn, fie cu zero Există comenzi pentru ambele opțiuni Următorul grup de instrucțiuni este destinat operațiilor aritmetice cu posibila setare a biților în registrul de stare a procesorului Pe mașinile CISC, majoritatea instrucțiunilor stabilesc coduri de stare, dar pe o mașină RISC acest lucru este nedorit deoarece limitează capacitatea compilatorului de a sorta instrucțiunile pentru a minimiza întârzierile Dacă ordinea inițială a comenzilor este A B C, unde A stabilește codurile de condiție și B le verifică, atunci compilatorul nu va putea insera o comandă C între A și B dacă C stabilește și coduri de condiție Din acest motiv, multe comenzi au două opțiuni, iar compilatorul o folosește de obicei pe cea care nu setează coduri de condiție decât dacă intenționează să le verifice mai târziu Pentru a specifica setarea codurilor de stare, programatorul adaugă un sufix „S” la codul operațional, cum ar fi ADDS Un bit special din instrucțiune îi spune procesorului să seteze coduri de stare Comenzile de înmulțire, împărțire semnată și împărțire fără semnă sunt, de asemenea, acceptate Grupul de instrucțiuni de schimbare include o instrucțiune de schimbare la stânga și două instrucțiuni de schimbare la dreapta Fiecare dintre ele funcționează cu registre de de biți Instrucțiunile de schimbare sunt utilizate în principal pentru manipularea biților Round robin este folosit în principal în operațiuni și procesare criptografice i rpfіі la i Majoritatea maniilor CISC au o varietate destul de mare de opțiuni de schimbare regulată și ciclică, dar aproape toate sunt destul de utile Niciunul dintre dezvoltatorii compilatorului nu îi va plânge Instrucțiunile logice sunt similare cu cele aritmetice Acest grup include valorile nule ȘI (ȘI), EOR (SAU EXCLUSIV), ORR (SAU), tst, teq și BIC Precizia ultimelor trei comenzi este îndoielnică, dar pot fi executate în ciclul ІІ/Ііні și nu necesită aproape nicio coacere hardware suplimentară PG și, prin urmare, sunt adesea incluse în setul de instrucțiuni Chiar și dezvoltatorii mașinilor HIS sunt uneori tentați Următorul grup conține comenzi de transfer de control Simbolurile Mn desemnează un grup de comenzi care fac tranziții în funcție de diferite condiții Instrucțiunile BLcc fac același lucru, dar plasează și adresa următoarei instrucțiuni în registrul de legătură (R ) Sunt convenabile pentru implementarea apelurilor de procedură Spre deosebire de alte arhitecturi RISC, nu există nicio comandă specială pentru a sări la o adresă dintr-un registru O astfel de comandă este ușor de sintetizat de comanda Li mo, ѵ care folosește contorul de comenzi (K ) ca receptor Există două moduri de a apela proceduri Prima comandă BLcc utilizează formatul de salt din Fig cu un offset de de biți față de computer ho vă permite să săriți la orice comandă la MB distanță de cea actuală în orice direcție A doua instrucțiune BLcc sare la adresa din registrul dat Poate fi folosit pentru a implementa apeluri de procedură legate dinamic (de exemplu, funcții virtuale C++) apeluri N'Pi al căror offset este mai mare de MB Ultimul grup conține comenzi care nu se încadrează în niciuna dintre celelalte i grupuri Instrucțiunea MOVT a fost introdusă deoarece nu a fost posibilă plasarea unui operand imediat pe de biți într-un registru Instrucțiunea MOVT setează biții de la la și apoi următoarea instrucțiune transmite biții rămași folosind un format care nu are legătură Instrucțiunile MRS și MSR vă permit să citiți și să scrieți (Processor State Record (PSR) Instrucțiunile SWP realizează permutarea atomică a conținutului unui registru și a unui cuvânt de memorie Ele implementează primitivele de sincronizare multiprocesor, care vor fi discutate în Capitolul În cele din urmă, instrucțiunea SWI inițiază o întrerupere software - Cu alte cuvinte, apelează o funcție de sistem Comenzi ATmegal Setul de instrucțiuni ATmegal este foarte simplu Toate sunt prezentate în tabel Fiecare linie a tabelului conține un cod mnemonic, o scurtă descriere și un fragment de pseudo-cod care explică acțiunea comenzii Abundența instrucțiunilor M()V pentru mutarea datelor între registre este destul de de înțeles Sunt furnizate și comenzi pentru împingerea elementelor pe stivă și scoaterea lor din stivă Indicatorul de stivă este setat într-un registru special de biți (SP) Memoria poate fi accesată prin adresă directă, înregistrați adresare indirectă sau înregistrați adresare indirectă cu un offset Pentru a permite adresarea până la KB, instrucțiunea de încărcare imediată a adresei este de de biți Moduri de adresare indirectă Capitolul Stratul de arhitectură al setului de instrucțiuni utilizați perechi de registre X, Y și Z, combinând două re de biți într-unul de biți Tabelul Set de instrucțiuni pentru procesorul ATmegal Comanda Descriere Semantică jd ADAUGĂ DST, SRC Adăugați DST * - DST + SRC ADC DST SRC Carry add DST * - DST + SRC + C ADIW DSTJMM Adăugarea directă a cuvintelor DST+ :DST "- DST+ :DST IMM J SUB DSTSRC Scădere DST * - DST - SRC SUBI DSTJMM Scăderea directă a DST * - dst - imm SBC DSTSRC Carry Scădere DST la SP -> k= — Valoare FP veche = — Valoare FP veche = Adresa de retur Adresa de retur j= j= I= i= FP n= FP n= SP -> k L k= k= k= — Adresă de returnare Valoare FP veche = — Valoare FP veche = Valoare FP veche = Valoare veche FP = Adresa de retur Adresa de retur Adresa de retur j= j= j= j= І= І= i= i= FP - n= n= n= n= HP > k k= k= k= k= Valoare FP veche Valoare FP veche Valoare FP veche Valoare FP veche Valoare FP veche Adresa de retur Adresa de retur Adresa de retur Adresa de retur Adresa de retur j= j= j= j= j= І= І= І= i= i= hP-> n= n= n= n= n= o implorare d Orez Starea stivei în timpul execuției programului din lista indicator de legătură) Diferite mașini manipulează indicatorul de cadru puțin diferit, uneori plasându-l chiar în partea de jos a cadrului stivei, alteori în partea de sus și alteori în mijloc, ca în Fig În acest sens, merită să comparăm Fig cu fig pentru două moduri diferite de a trata un pointer adormit Alte moduri sunt posibile Dar, în orice caz, trebuie să fie posibilă ieșirea din procedură și restabilirea stării anterioare a stivei Codul care reține vechiul indicator de cadru, setează noul indicator de cadru și incrementează indicatorul de stivă pentru a rezerva spațiu pentru variabilele locale se numește prolog de procedură La ieșirea* din procedură, stiva trebuie curățată, iar această problemă este rezolvată în epilogul procedurii prostului Una dintre cele mai importante caracteristici ale unui computer este cât de repede poate rula prologul și epilogul Daca sunt foarte lungi si ruleaza incet, nu este profitabil sa apelezi la proceduri Comenzile ENTER și LE AVG din Cori au fost concepute special pentru a face ca prologurile și epilogurile procedurilor să funcționeze eficient Desigur, ele acceptă un anumit model de gestionare a indicatorului de cadru, iar dacă compilatorul acceptă un alt model, aceste comenzi nu pot fi utilizate Acum înapoi la Turnul din Hanoi Fiecare apel de procedură adaugă un nou cadru la stivă, iar fiecare ieșire din procedură elimină un cadru din stivă turnuri ( , lj ) Pe fig Figura a arată starea stivei imediat după apelul la procedură În primul rând, procedura verifică dacă n este egal cu unu, iar după ce se stabilește că n = , populează k și efectuează apelul turnuri ( , , ) Starea stivei după finalizarea acestui apel este prezentată în Fig , b În plus, procedura este executată din nou (procedura apelată începe întotdeauna de la început) De data aceasta condiția n = eșuează din nou, așa că procedura completează din nou k și apelează turnuri ( , , ) Starea stivei după acest apel este prezentată în Fig , c Contorul programului indică începutul procedurii De data aceasta, condiția este adevărată și pe ecran este afișat un șir Apoi se iese din procedura Pentru a face acest lucru, un cadru este șters și valorile FP și SP sunt redefinite (Fig , d) În continuare, executarea procedurii continuă de la adresa de retur: turnuri ( , , ) Acest apel împinge un nou cadru pe stivă (Figura e) Se imprimă o altă linie După ieșirea din procedură, cadrul este scos din stivă Apelurile de procedură continuă până la finalizarea execuției primei proceduri și până la cadrul prezentat în Fig , a, nu va fi scos din stivă Pentru a înțelege mai bine cum funcționează recursiunea, este necesar, folosind doar pix și hârtie, să reproducem complet execuția procedurii turnuri ( ^ , ) Coroutine Într-o secvență normală de apel, există o diferență evidentă între procedura de apelare și procedura apelată Luați în considerare procedura A, care numește procedura B (Figura ) Procedura de apelare Procedura numită Procedura A este apelată din programul principal Procedura A readuce controlul programului principal A Orez Executarea unei proceduri apelate începe întotdeauna de la începutul acesteia Procedura B rulează o perioadă, apoi revine la A La prima vedere, aceste situații pot părea a fi simetrice, deoarece atât A cât și B nu sunt programe principale - sunt proceduri (cu toate acestea, procedura A poate fi apelată de programul principal, dar în acest caz este irelevant) Mai mult, controlul va fi mai întâi transferat de la A la B (la apel), iar apoi de la B la A (la întoarcere) Diferența este că atunci când controlul trece de la A la B, procedura B începe de la început; iar când controlul este transferat de la B înapoi la A, execuția procedurii A continuă nu de la început, ci de la comandă, І № în urma apelului la procedura B Dacă A rulează un timp și apoi apelează din nou procedura B, execuția lui B începe din nou de la început și nu din punctul după care controlul a fost returnat la procedura A Dacă, în timpul execuției, procedura A apelează procedura B în mod repetat, procedura B începe de la început de fiecare dată, dar procedura A nu începe niciodată de la început Această diferență se reflectă în modul în care este transferat controlul între A și B Când procedura A îl apelează pe B, folosește o instrucțiune de apel de procedură care plasează adresa de retur (adică adresa instrucțiunii care urmează procedura din pj) * program) în locul în care atunci va fi ușor să îl extragi, de exemplu, în partea de sus a stivei Apoi introduce adresa procedurii B în contorul de programe pentru a finaliza apelul Pentru a ieși din procedura B, nu folosim o instrucțiune de apel de procedură, ci o instrucțiune de ieșire a procedurii, care pur și simplu scoate adresa de retur din stivă și o pune în contorul de programe Cu toate acestea, uneori doriți ca ambele proceduri (A și B) să se apeleze reciproc ca procedură, așa cum se arată în Figura La întoarcerea de la B la A, rutina prostească B sare la operatorul care a fost precedat de apel Procedura A este apelată din programul principal Procedura A readuce controlul programului principal A Orez După terminarea corutinei, execuția începe de unde a rămas ultima dată, nu de la început procedura B Când procedura A transferă controlul către procedura B, aceasta nu revine chiar la începutul lui B (cu excepția primei oară), ci la locul înainte de care a avut loc apelul anterior către A Două proceduri care funcționează în acest fel se numesc corutine Coroutinele sunt utilizate în mod obișnuit pentru procesarea paralelă a datelor pe un singur procesor Fiecare corutine functioneaza parca simultan cu alte corutine, ca si cum ar avea propriul procesor Această abordare simplifică programarea unor aplicații De asemenea, este util pentru testarea software-ului destinat execuției multiprocesor Comenzile obișnuite CALL și RETURN nu sunt potrivite pentru apelarea corutinelor, deoarece deși adresa de salt este luată din stivă, ca și în cazul controlului de returnare, dar implicația controlului de returnare, atunci când este apelată o corutine, adresa de retur este plasată într-un anumit loc pentru a reveni la el mai târziu Ar fi bine dacă ar exista un jomand care să folosească un contor de program în loc de partea de sus a stivei Această instrucțiune trebuie mai întâi să scoată vechea adresă de retur de pe stivă și să o împingă într-un registru intern, apoi să împingă contorul de program pe stivă și, în sfârșit, să copieze conținutul registrului intern și al contorului programului Deoarece un cuvânt este scos din stivă și altul este împins pe stivă, starea indicatorului de stivă nu se schimbă O astfel de comandă este foarte rară, așa că în majoritatea cazurilor trebuie modelată din mai multe comenzi Prinderea de excepții Captarea excepțiilor este un tip special de apel de procedură care are loc în anumite condiții, de obicei foarte grave, dar rare () Un exemplu de astfel de condiție este un preaplin Pe majoritatea procesoarelor, dacă rezultatul unei operații aritmetice depășește cel mai mare număr permis, apare o excepție și este prinsă Aceasta înseamnă că fluxul de control merge într-o locație fixă de memorie și nu continuă secvenţial mai departe Această celulă fixă conține o comandă pentru a trece la o procedură specială (manager de excepții) care efectuează o anumită acțiune, cum ar fi imprimarea unui mesaj de eroare Dacă rezultatul operației este în intervalul permis, nu apare nicio excepție Important este că excepțiile pot fi aruncate în software și sunt prinse în hardware sau la nivel de firmware Pe lângă identificarea unei excepții, există o altă modalitate de a determina dacă a avut loc o depășire Pentru a face acest lucru, trebuie să aveți un registru de bit care va fi setat ori de câte ori are loc o depășire În acest caz, un programator care ar dori să verifice rezultatul pentru depășire ar trebui să includă o instrucțiune de depășire în program după fiecare instrucțiune aritmetică, ceea ce este foarte incomod În comparație cu verificarea programatică explicită, capturarea excepțiilor economisește timp și memorie Captarea excepțiilor poate fi implementată nu numai în hardware, ci și cu ajutorul firmware-ului prin aceeași verificare explicită În acest caz, când la detectarea unui overflow, adresa handler-ului de excepții este încărcată în contorul programului Verificarea la nivel de firmware durează mai puțin timp decât verificarea la nivel de program, deoarece poate fi efectuată în același timp cu o altă acțiune În plus, o astfel de verificare economisește memorie, deoarece poate fi implementată doar într-un singur loc, de exemplu, în bucla principală a firmware-ului, indiferent de câte instrucțiuni aritmetice există în programul principal Cele mai frecvente condiții care pot provoca excepții includ: depășiri și dispariții în virgulă mobilă, depășiri la operațiuni cu numere întregi, încălcări de securitate, cod operațional nedefinit, depășire a stivei, pornirea unui dispozitiv I/O inexistent, încercarea de a prelua un cuvânt cu o adresă ciudată, împărțiți la întreruperi Întreruperile sunt modificări ale fluxului de control care nu sunt cauzate de programul în sine, ci de altceva Întreruperile sunt de obicei asociate cu procesul I/O De exemplu, un program poate instrui discul să înceapă transferul de informații și să declanșeze o întrerupere de îndată ce transferul este complet Ca și în cazul excepțiilor, întreruperile opresc programul și transferă controlul către o Rutină Serviciu de întrerupere* (ISR) sau către un handler de întreruperi care efectuează anumite acțiuni După finalizarea acestor acțiuni, operatorul de întrerupere va transfera controlul programului întrerupt Trebuie să repornească procesul întrerupt în aceeași stare în care era atunci când a fost întrerupt Aceasta înseamnă că starea anterioară a tuturor registrelor interne (adică starea care era înainte de întrerupere) trebuie restabilită Diferența dintre excepții și întreruperi este că excepțiile sunt sincrone cu programul, în timp ce întreruperile sunt asincrone Dacă reporniți programul de mai multe ori cu aceleași date de intrare, excepții vor apărea în aceleași locuri în program de fiecare dată, dar întreruperile nu vor apărea (în exemplul nostru de disc, o întrerupere va apărea numai când discul a finalizat transferul de date, și nu atunci când este cerut de program) Motivul pentru reproductibilitatea excepțiilor și nereproductibilitatea întreruperilor este că primele sunt apelate direct de program, iar cele din urmă indirect Pentru a înțelege cum funcționează întreruperile, luați în considerare un exemplu comun: un computer trebuie să imprime un șir de caractere pe terminalul său Programul memorează mai întâi toate caracterele care urmează să fie afișate pe ecran, inițializează variabila globală ptr pentru a indica începutul bufferului și setează a doua variabilă globală la numărul de caractere care urmează să fie afișate pe ecran Programul verifică apoi dacă terminalul este gata și, dacă da, tipărește primul caracter pe ecran (de exemplu, folosind registrele prezentate în Figura ) Prin pornirea procesului I/O, CPU este eliberat și poate rula un alt program sau poate face altceva După un timp, simbolul este afișat pe ecran După aceea, poate fi declanșată o întrerupere Pașii principali sunt enumerați mai jos (în formă simplificată) Acțiuni hardware: Controlerul dispozitivului încarcă linia de întrerupere pe magistrala de sistem Când CPU este gata să gestioneze o întrerupere, setează caracterul de confirmare a întreruperii pe magistrală Când controlerul dispozitivului detectează că semnalul de întrerupere a fost afirmat, plasează un mic întreg pe liniile de date pentru a se „introduce” (adică pentru a indica ce dispozitiv este sursa întreruperii) Acest număr se numește vector de întrerupere CPU citește vectorul de întrerupere din magistrală și îl stochează temporar CPU împinge contorul de program și cuvântul de stare a programului în stivă (> CPU localizează noul contor de program folosind vectorul de întrerupere ca index într-un tabel din partea de jos a memoriei Dacă, de exemplu, contorul de program este de octeți, atunci vectorul de întrerupere n corespunde adresei u Noul contorul programului indică începutul programului Gestionarea întreruperilor pentru dispozitivul care este sursa întreruperii Adesea, cuvântul de stare a programului este încărcat sau modificat (de exemplu, pentru a bloca întreruperi ulterioare) Alte acțiuni sunt efectuate programatic: Managerul de întrerupere salvează toate registrele de care are nevoie pentru a putea fi restaurate ulterior Ele pot fi stocate pe stivă sau într-o masă de sistem Fiecare vector de întrerupere este partajat de toate dispozitivele de acest tip, deci nu se știe încă care terminal a cauzat întreruperea Numărul terminalului poate fi găsit citind valoarea unui registru După aceea, puteți citi orice alte informații despre întrerupere, cum ar fi codurile de stare Dacă apare o eroare I/O, aceasta trebuie tratată în acest moment Variabilele globale ptr și count sunt actualizate Primul este incrementat cu pentru a indica următorul octet, iar al doilea este decrementat cu pentru a indica faptul că a mai rămas cu octet mai puțin de ieșit Dacă numărul este încă mai mare decât , atunci nu toate caracterele au fost încă afișate Caracterul indicat în prezent de ptr este copiat în registrul tampon de ieșire Autorul nu are dreptate: aici vorbim despre numărul de întrerupere Fiecare tip de întrerupere are propriul său număr Termenul „vector de întrerupere” este folosit atunci când adresa operatorului de întrerupere este găsită prin numărul de întrerupere, iar această adresă este reprezentată de o singură valoare, dar de mai multe, adică este necesar să se inițialeze mai mult de un registru Cu alte cuvinte , adresa este reprezentată nu printr-o valoare scalară, ci printr-un vector multidimensional Notă științific ed Dacă este necesar, va fi emis un cod special care spune dispozitivului sau controlerului de întrerupere că întreruperea a fost procesată Toate registrele salvate sunt restaurate Comanda de ieșire întrerupere este executată, readucerea CPU la starea în care se afla înainte de întrerupere După aceea, computerul continuă să funcționeze din locul în care a fost suspendat Există un concept important de transparență asociat întreruperilor Când nu se întâmplă întrerupere, pot fi efectuate o varietate de acțiuni și pot fi lansate diverse tipuri de programe, dar când totul se termină, computerul ar trebui să revină exact la aceeași stare în care se afla înainte de întrerupere Un handler de întrerupere care are această proprietate se numește transparent Dacă computerul are un singur dispozitiv I/O, atunci întreruperile funcționează exact așa cum tocmai am descris Cu toate acestea, un computer mare poate conține multe dispozitive I/O, cu mai multe dispozitive care rulează în același timp, posibil pentru utilizatori diferiți Există o oarecare șansă ca, în timp ce gestionarea întreruperilor rulează, un alt dispozitiv I/O va încerca, de asemenea, să declanșeze propria întrerupere Există două abordări aici Primul este ca toți manipulatorii de întreruperi să prevină mai întâi (chiar înainte de salvarea registrelor) întreruperile ulterioare - în acest caz, întreruperile vor avea loc strict pe rând Cu toate acestea, acest lucru poate duce la probleme cu dispozitivele care nu pot fi inactive pentru o perioadă lungă de timp De exemplu, pe o linie de comunicație care acceptă o rată de transmisie de bps, simbolurile ajung la fiecare de microsecunde Dacă primul caracter este lăsat neprocesat când sosește al doilea, datele se vor pierde Dacă computerul are dispozitive de intrare-ieșire similare, atunci cel mai bine este să atribuiți o anumită prioritate fiecărui dispozitiv, mare - pentru dispozitivele mai critice, scăzută - pentru dispozitivele mai puțin critice CPU trebuie să aibă priorități, care sunt determinate de unul dintre câmpurile din cuvântul de stare a programului Dacă un dispozitiv cu prioritate n provoacă o întrerupere, operatorul de întrerupere trebuie să ruleze și cu prioritate n Dacă manipulatorul de întreruperi se execută la prioritatea n, orice încercare de a gestiona o întrerupere de la un alt dispozitiv cu o prioritate mai mică va fi ignorată până când manevrătorul de întreruperi se termină și CPU începe să execute programul cu prioritate inferioară În același timp, întreruperile de la dispozitivele cu o prioritate mai mare trebuie procesate fără întârziere Deoarece gestionatorii de întreruperi înșiși pot întrerupe, singura modalitate posibilă de a ajusta situația este de a face toate întreruperile transparente Luați în considerare un exemplu simplu cu mai multe pauze Lăsați computerul să aibă trei dispozitive I/O: o imprimantă, un hard disk și o linie RS cu prioritățile , și, respectiv, Inițial (t = , Che t - timp) programul utilizatorului funcționează La t = , imprimanta neașteptată va declanșa o întrerupere Managerul de întreruperi (ISR) este rulat de la imprimantă, așa cum se arată în fig La t = întreruperi sunt necesare de către linia RS Deoarece linia RS are o prioritate mai mare ( ) decât imprimanta ( ), este inițiată procesarea acestei întreruperi Întreruperea discului, prioritate , în așteptare Terminați linia RS ISR, primiți întrerupere de disc Întreruperea RSR , prioritate Prioritatea întreruperea imprimantei Aproximativ Închiderea unui disc ISR Oprirea unei imprimante ISR Program : ISR : Utilizator : Imprimantă : Linia RS ISR ISR disc : „ ѵ Timp și ISR; Program ! utilizator !imprimantă Utilizator Imprimanta utilizator Imprimanta utilizator Utilizator Grămadă II II II II Orez Un exemplu de întreruperi multiple Secvența acțiunilor Starea mașinii în care rulează imprimanta ISR este stocată în stivă, iar gestionarea întreruperilor de linie RS începe să se execute Puțin mai târziu, la t = , discul își încheie munca și semnalează acest lucru cu o întrerupere Cu toate acestea, prioritatea sa ( ) este mai mică decât prioritatea gestionarului de întrerupere ( ) care rulează în prezent, astfel încât CPU nu confirmă primirea semnalului de întrerupere, iar discul este forțat să aștepte La t = , linia RS ISR se termină și mașina revine la starea în care se afla înainte de întreruperea liniei RS , adică la starea corespunzătoare funcționării ISR imprimantei cu prioritate De îndată ce CPU comută la prioritatea , mai înainte de executarea primei instrucțiuni, discul cu prioritate se întrerupe și SR-ul discului este pornit După ce se încheie, rutina de întrerupere a imprimantei continuă din nou În cele din urmă, la t = , toate rutinele de întrerupere se termină și execuția programului utilizatorului se reia de unde a rămas De la , toate procesoarele Intel au avut două niveluri (prioritate) de întreruperi: întreruperi mascate și nemascabile Întreruperile nemascabile sunt de obicei folosite doar pentru a raporta situații foarte grave, cum ar fi erorile de paritate a memoriei Toate dispozitivele I/O au o singură întrerupere masabilă Când un dispozitiv I/O solicită o întrerupere, CPU utilizează vectorul de întrerupere în timp ce indexează tabelul cu de intrări pentru a găsi adresa operatorului de întrerupere Intrările din tabel sunt descriptori de segment de octeți Tabelul poate începe oriunde în memorie Registrul global indică începutul său wwvnw HMuupii i^imand Cu un singur nivel de întrerupere, nu există nicio modalitate ca CPU să aibă un dispozitiv cu prioritate înaltă să întrerupă un handler de întrerupere cu prioritate medie în timp ce un dispozitiv cu prioritate scăzută interferează Procesoarele Intel folosesc de obicei un controler de întrerupere extern (de exemplu A) pentru a rezolva problema La prima întrerupere (de exemplu, cu prioritate n), procesorul este suspendat Dacă apare o altă întrerupere cu prioritate mai mare după aceea, controlerul de întrerupere va declanșa întreruperea a doua oară Dacă a doua întrerupere are o prioritate mai mică, ea nu este inițiată până la sfârșitul primei Pentru ca acest sistem să funcționeze, controlerul de întrerupere trebuie să știe într-un fel că rutina de întrerupere curentă sa încheiat Prin urmare, când procesarea întreruperii curente este complet încheiată, CPU trebuie să trimită o comandă specială controlerului de întrerupere turnul din hanoi Acum că am explorat nivelul arhitecturii setului de instrucțiuni al celor trei mașini, trebuie să rezumam totul Să aruncăm o privire mai atentă la același exemplu de rezolvare a problemei „Turnul din Hanoi”) Lista arată versiunea Java a acestui program Cu toate acestea, pentru a evita problemele cu Java I/O, pentru mașinile Coge i și OMAP , vom traduce versiunea programului nu în Java, ci în C Singura diferență este înlocuirea instrucțiunii Java println cu o instrucțiune standard în limbaj C : printf("Mutați discul de la %d la %d\n", i, j) Sintaxa liniei din instrucțiunea printf nu este importantă (linia este tipărită literal, cu excepția caracterelor %d, ceea ce înseamnă că următorul întreg va fi reprezentat în notație zecimală) Singurul lucru important aici este că procedura este apelată cu trei parametri: un șir de format și două numere întregi Am folosit C pentru Coge i și OMAP deoarece biblioteca Java I/O nu este disponibilă pentru aceste mașini, dar biblioteca C I/O este Diferența este minimă - doar o singură linie de ieșire pe ecran Rezolvarea problemei „Turnul din Hanoi” în asamblatorul Coge I Lista arată un posibil rezultat al traducerii unui program C pentru un procesor Coge Registrul EBP este folosit ca indicator de cadru I Primele două cuvinte sunt necesare pentru legare, deci primul parametru n (sau N, deoarece macro-asamblatorul nu face distincție între majuscule și minuscule) este în celula EBP + , urmat de parametrii i și j în celulele EBP + și EBP + , respectiv Variabila locală k este în EUR + Lista Rezolvarea problemei „Turnul din Hanoi” pentru Soge I MODEL PLAT PUBLIC turnuri ; IXTERN printf:NEAR ; COD turnuri: PUSH EBP ; MOV EBP, ESP ; • CMP[EBP+ ], ; JNELI ; MOV EAX, [EBP+ ]; PUSH EAX ; MOV EAX, [EBP+ ]; PUSH EAX ; PUSH OFFSET FLAT:format ; CALL printf ; ADAUGĂ ESP, ; MP Gata'; LI: MOV EAX, ; SUB EAX, [EBP+ ] ; SUB EAX, [EBP+ ] ; MOV [EBP+ ], EAX; PUSH EAX ; MOV EAX, [EBP+ ]; PUSH EAX ; MOV EAX, [EBP+ ]; DEC EAX ; PUSH EAX ; CALL towers ; ADAUGĂ ESP, ; MOV EAX, [EBP+ ]; PUSH EAX' MOV EAX, [EBP+ ]; PUSH EAX ; IMPINGERE ; CALL towers ; ADAUGĂ ESP, ; MOV EAX, [EBP+ ]; PUSH EAX ; MOV EAX, [EBP+ ] ; PUSH EAX ; MOV EAX, [EBP+ ]; DEC EAX ; PUSH EAX ; CALL towers ; ADAUGĂ ESP, Gata: PLECA ; RET ; DATE format DB „Mutați discul c %d END Compilează pentru coge export 'turnuri' import printf salvează EBP (indicatorul de cadru) setează un nou indicator de cadru peste ESP if(n==l) ramura dacă n nu este egal cu printfi, j); salvarea parametrilor i, j și șirul de formatare este împins pe stivă în ordine inversă (cerința limbajului C) OFFSET FLAT este adresa de formatare apelează procedura printf elimina parametrii din stivă terminare începe calculul k= -ij EAX= -i EAX= -ij k=EAX începutul turnurilor de procedură (nl, i, k) EAX=i împinge i EAX=n EAX=nl împinge n- turnuri de apelare proceduri (n- , i, -ij) pe stivă elimină parametrii din stivă începutul procedurii turnuri ( , i, j) împinge j EAX=i împinge pe stiva i împinge pe stiva apelează turnuri ( , i, j) elimină parametrii din stivă începutul procedurii turnuri (nl, -ij, i) împinge i EAX=k împinge pe stivă la EAX = n EAX=n- împinge n- turnuri de apel de procedură (nl, -ij, i) pe indicatorul stivei de ajustare a stivei, pregătiți-vă pentru a ieși, reveniți la apelant la %d\n" ; format șir Procedura începe prin crearea unui nou cadru la sfârșitul celui vechi Pentru a face acest lucru, valoarea registrului ESP este copiată în indicatorul de cadru EBP Atunci n este comparat cu , iar dacă n > , săriți la instrucțiunea else Apoi, codul împinge trei valori pe stivă: adresa șirului de format, i și j, apoi se autoinvocă Parametrii sunt împinși pe stivă în ordine inversă, așa cum este cerut de limbajul C Un pointer către șirul de format trebuie plasat în partea de sus a stivei Procedura printf are un număr variabil de parametri, iar dacă parametrii sunt împinși pe stivă în ordine directă, procedura nu va ști unde se află șirul de format pe stivă După apelarea procedurii, este adăugat la registrul ESP pentru a elimina parametrii din stivă Ele nu sunt de fapt eliminate din memorie, dar schimbarea registrului ESP le face inaccesibile prin operațiuni normale de stivă Execuția secțiunii else începe la eticheta L Aici, expresia - i - j este mai întâi evaluată, iar valoarea rezultată este stocată în variabila k Indiferent de valorile lui i și j, numărul de discuri de pe al treilea pion este întotdeauna - i - j Stocarea valorii în variabila k elimină necesitatea evaluării acestei expresii a doua oară Procedura se autoapelează apoi de trei ori, de fiecare dată cu parametri noi După fiecare apel, stiva este eliberată Programatorii începători au uneori dificultăți Recursiunea derutează uneori oamenii Dar, de fapt, nu este deloc complicat Parametrii sunt pur și simplu împinși pe stivă, după care procedura se autoapelează Rezolvarea problemei „Turnul din Hanoi” în asamblatorul OMAP Acum luați în considerare același program de asamblare OMAP (Listing ) Deoarece programul OMAP este complet ilizibil chiar și după multă practică, am decis să definim câteva nume simbolice pentru a clarifica lucrurile Pentru ca un astfel de program să funcționeze, trebuie să fie rulat printr-un program numit cpp (preprocesorul C) înainte de asamblare Folosim litere mici aici deoarece asamblerul OMAP o cere (acest lucru în cazul în care cititorii doresc să tastați acest program și să-l ruleze) Lista - Rezolvarea problemei „Turnul din Hanoi” pentru OMAR tfdefine Param© r tfdefine Paraml GI #definiți Param r tfdefine FormatPtr G #definiți kg tfdefine n minus l text r turnuri: push {z , z , z , gb, z , g} shoѵr , Paraml tosgb, Param p Param©, # bne else movw FormatPtr,#:lowerl :format movt FormatPtr,#:irreg b:format bl printf pop {r , r , r , gb, r , pc} @ salvați adresa de retur @ și registrele utilizate @ (n== )? @ dacă nu, mergeți la secțiunea else @ indicatorul de încărcare @ pentru a formata șirul @ prinț move olse: rsb to, rl, # subs k, k, r adaugă n minus , r , #-l SHOVG , n minus l movr j k bl turnuri SHOVG , # movrl, r movr j r bl turnuri movr j n minus l movrl, k movr j r bl towers pop {gz, r , r , r l r , pc} principal global principal: împinge {Ir} movParamOj # movParamlj # movParam j Param© bl towers pop {pc} format: ascii „Mutați un disc de la %d în k= - i - j ( calculează (n- ) ( pentru apel recursiv @ caii towers(n-lj i, k) @ caii towers(lj k, j) @ caii towers(n-lj k, j) @ restabiliți registrele modificate @ și controlul de întoarcere @ salvați adresa de retur @ caii towers( j , ) @ extrage adresa de retur^ @ return control %d\n\ " Conform algoritmului, versiunea OMAP este identică cu versiunea Coge I În ambele cazuri, n este verificat mai întâi, iar dacă n > , săriți la else Principalele dificultăți ale versiunii OMAP sunt asociate cu unele caracteristici ale arhitecturii de instrucțiuni Codul OMAP trebuie să treacă mai întâi adresa șirului de format la printf, dar aparatul nu poate muta pur și simplu adresa în registrul care conține parametrul de ieșire, deoarece nu puteți introduce o constantă de de biți în registru într-o singură comandă Pentru a face acest lucru, trebuie să executați două comenzi: MOVW ȘI MOVT Nu este nevoie să ajustați stiva după apel, deoarece fereastra de înregistrare este ajustată automat de comenzile PUSH și POP la începutul și sfârșitul procedurii Aceste instrucțiuni asigură, de asemenea, că adresa de retur este salvată și restaurată la intrare, registrul LR este salvat, iar la ieșire, registrul PC-ului este salvat Arhitectura IA- si procesor Itanium În jurul anului , specialiștii Intel au început să realizeze că va veni în curând momentul în care tot ce era posibil va fi stors din linia de procesoare IA- Modelele mai noi s-au îmbunătățit doar datorită noilor tehnologii de producție care au făcut posibilă reducerea dimensiunii tranzistorilor (și, prin urmare, creșterea vitezei de ceas) Cu toate acestea, a devenit din ce în ce mai dificilă creșterea vitezei de lucru, iar motivul pentru aceasta au fost limitările inerente arhitecturii comenzilor IA- Singura soluție eficientă la problema în dezvoltarea de noi procesoare este trecerea de la IA- la o nouă arhitectură de instrucțiuni Acestea sunt planurile pe care Intel le construiește Mai mult, ar trebui să lanseze două noi linii Prima dintre acestea, numită EMT- , este o versiune extinsă a Pentium cu registre de de biți și un spațiu de adrese de de biți Această arhitectură rezolvă problema spațiului de adrese, dar păstrează complexitățile de implementare ale predecesorilor săi Poate fi numită o versiune extinsă a arhitecturii Pentium O altă arhitectură dezvoltată în comun de Intel și Lewlett Packard se numește IA- Aceasta este deja o mașină cu drepturi depline pe de biți, nu o extensie a unei mașini pe de biți În plus, este izbitor de diferit de IA- în multe privințe Inițial, IA- ar trebui să fie adus pe piața sistemelor de server profesionale, dar este foarte posibil ca ulterior această arhitectură să fie consolidată pe segmentul desktop În orice caz, arhitectura IA- , implementată pentru prima dată în linia de procesoare Itanium, este atât de diferită de tot ceea ce am considerat înainte, încât este pur și simplu necesar să o cunoaștem mai bine Deci, restul secțiunii este dedicată arhitecturii IA- ca atare și implementării acesteia în procesoarele din seria Itanium Problema IA- Înainte de a trece la o revizuire detaliată a arhitecturii IA- și a procesorului Itanium , este util să înțelegem pentru ce este de fapt proastă arhitectura IA- și ce probleme intenționează Intel să rezolve prin dezvoltarea unei noi arhitecturi Problema principală este că IA- este o arhitectură veche de instrucțiuni cu proprietăți complet nepotrivite pentru tehnologiile moderne Aceasta este o arhitectură CISC tipică cu lungimi diferite de instrucțiuni și un număr mare de formate diferite care sunt dificil de decodat rapid și din mers Tehnica actuală funcționează cel mai bine cu arhitecturile RISC în care instrucțiunile sunt uniforme ca dimensiune și opcode-ul are lungime fixă, astfel încât este ușor de decodat Deși instrucțiunile arhitecturii IA- în timpul execuției programului pot fi împărțite în micro-operații precum comenzile RISC, dar acest lucru necesită hardware suplimentar (spațiu pe cip), în plus, necesită timp și complică dezvoltarea Acesta este primul dezavantaj IA- este o arhitectură orientată spre memorie și instrucțiuni cu două adrese Arhitecturile de instrucțiuni de încărcare/stocare sunt populare în prezent, în care accesările la memorie sunt efectuate doar pentru a plasa operanzi în registre, iar toate calculele sunt efectuate folosind instrucțiuni de registru cu trei adrese Deoarece viteza procesorului crește mult mai repede decât memoria, situația cu ІА- se înrăutățește în timp Acesta este al doilea dezavantaj Arhitectura IA- conține un set mic și neregulat de registre Acest lucru complică dezvoltarea compilatoarelor, în plus, din cauza numărului mic de registre de uz general (patru sau șase, în funcție de locul în care sunt plasate registrele ESI și EDI), trebuie să scrieți în mod constant rezultate intermediare în memorie, ceea ce duce la suplimentare accese de memorie, chiar și atunci când nu sunt necesare de logica lucrurilor Acesta este al treilea dezavantaj Arhitectura IA- si procesor Itanium Din cauza numărului insuficient de registre, există multe situații de dependență, în special dependențe WAR, deoarece rezultatele intermediare trebuie plasate undeva și nu există registre suplimentare Din cauza lipsei registrelor, se impune constant înlocuirea acestora (adică folosirea registrelor ascunse) Pentru a evita pierderile prea frecvente ale memoriei cache, comenzile trebuie executate în afara ordinului Cu toate acestea, semantica arhitecturii IA- definește întreruperi precise, astfel încât instrucțiunile executate în afara ordinii trebuie să scrie rezultatele în registrele de ieșire în ordine strictă Toate acestea sunt foarte greu de implementat în hardware Acesta este al patrulea dezavantaj Pentru ca viteza de funcționare să fie ridicată, sistemul trebuie să fie puternic canalizat Cu toate acestea, aceasta înseamnă că este nevoie de multe cicluri pentru a executa orice instrucțiune Prin urmare, predicția precisă a ramurilor devine esențială, deoarece numai instrucțiunile necesare trebuie să intre în conductă Cu toate acestea, chiar dacă procentul de predicții incorecte este scăzut, performanța este redusă semnificativ Acesta este al cincilea dezavantaj Pentru a evita problemele de predicție greșită a ramurilor, procesorul trebuie să execute instrucțiunile speculative, cu toate consecințele care decurg Acesta este al șaselea dezavantaj Nu vom enumera mai departe deficiențele, deoarece este deja clar că în spatele lor există o problemă reală Ceea ce nu am menționat încă este că adresele IA- pe de biți limitează dimensiunea programelor individuale la GB, ceea ce este o problemă serioasă pentru serverele de înaltă performanță Să presupunem că această problemă este rezolvată în arhitectura EMT- , dar celelalte* dezavantaje rămân Situația cu IA- poate fi comparată cu starea de lucruri din mecanica cerească chiar înainte de apariția lui Copernic La acea vreme, astronomia era dominată de teoria geocentrică, conform căreia Pământul este centrul universului și este staționar, iar planetele se mișcă în jurul lui Totuși, noile observații au arătat tot mai multe inconsecvențe ale acestei teorii cu realitatea, până când în cele din urmă vechiul model s-a prăbușit sub greutatea propriei sale complexități interne Intel se afla aproape in aceeasi pozitie Numeroșii tranzistori din procesorul Core i sunt dedicați exclusiv conversiei instrucțiunilor CISC în instrucțiuni RISC, rezolvării conflictelor, predicției de ramificație, corectării consecințelor previziunilor greșite și multor alte sarcini de acest fel, lăsând puțin sau deloc lucru real de care are nevoie utilizatorul unele dintre aceste tranzistoare Prin urmare, Intel a ajuns la următoarea concluzie: trebuie să aruncați IA- la coșul de gunoi și să o luați de la capăt (IA- ) Arhitectura EMT- este destinată doar să câștige ceva timp, lăsând problema nerezolvată Model IA- - calcule cu paralelism explicit de instrucțiuni Principiul de bază al organizării arhitecturii IA- este transferul încărcăturii de la timpul de execuție la timpul de compilare Procesorul Core І în timpul execuției reordonează instrucțiunile, înlocuiește registrele, distribuie Acesta stabilește blocuri funcționale și îndeplinește multe alte funcții, ceea ce duce la utilizarea maximă a tuturor resurselor hardware În modelul IA- , aceste sarcini sunt acum rezolvate de compilator Ca rezultat, generează un program care poate fi executat fără manipulare nejustificată a hardware-ului De exemplu, în Coga i , compilatorul acționează ca și cum ar fi doar registre în mașină, deși sunt de fapt dintre ele, ca urmare, în timpul execuției programului, trebuie să ieși cumva pentru a evita interdependențele Conform arhitecturii IA- , compilatorul primește informații fiabile despre numărul de registre din mașină și apoi generează un program în care nu există conflicte între registre În plus, compilatorul monitorizează încărcarea blocurilor funcționale și nu rulează instrucțiuni care ar trebui să se refere la blocuri funcționale ocupate Modelul în care paralelismul hardware este vizibil pentru compilator se numește EPIC (Explicitly Parallel Instruction Computing) Într-o anumită măsură, modelul EPIC poate fi considerat o evoluție a tehnologiei RISC Unele caracteristici ale IA- cresc semnificativ productivitatea Printre acestea se numără reducerea numărului de accesări la memorie, programarea instrucțiunilor, reducerea numărului de salturi condiționate și operațiuni speculative Vom discuta despre toate aceste caracteristici atât din punct de vedere teoretic, cât și în contextul implementării lor în Itanium Reducerea numărului de accesări la memorie Modelul de memorie Itanium este destul de simplu Este furnizat un total de de octeți de memorie liniară Comenzile disponibile vă permit să accesați blocuri de memorie de , , , , și octeți (aceasta din urmă valoare a fost introdusă pentru compatibilitatea cu numerele în virgulă mobilă de de biți ale standardului IEEE ) Nu există o nevoie categorică de a alinia accesele la memorie de-a lungul granițelor naturale, dar performanța este mai scăzută fără aliniere Memoria poate fi fie big endian, fie little endian; un format sau altul este setat de un bit special într-un registru încărcat de sistemul de operare Lucrul cu memoria în computerele moderne este considerat un blocaj Acest lucru se datorează faptului că procesoarele funcționează mult mai rapid decât modulele de memorie Numărul de accesări la memorie poate fi redus prin plasarea unui cache mare de prim nivel pe cipul procesorului și a unui cache și mai mare de nivel al doilea în imediata apropiere a cipului Două module de memorie cache sunt echipate cu toate procesoarele moderne În același timp, există și alte metode pentru a reduce cantitatea de interacțiune cu memorie, iar unele dintre ele sunt implementate în IA- Cea mai bună modalitate de a accelera accesul la memorie este să efectuați această operație în fundal Procesorul Itanium are de registre de uz general pe de biți Primele dintre ele sunt statice, iar restul de sunt grupate într-o stivă de registre, care amintește de fereastra de registre a altor procesoare RISC (de exemplu, UltraSPARC) Spre deosebire de UltraSPARC, numărul de registre disponibile pentru un program variază de la o procedură la alta Ca rezultat, fiecare procedură are acces la de registre statice și un număr (variabil) de registre alocate dinamic Arhitectura IA- si procesor Itanium Când procedura este apelată, indicatorul stivei de registre este deplasat astfel încât parametrii de intrare să fie vizibili în registre, dar registrele în sine nu sunt distribuite între variabilele locale Procedura în sine determină numărul de registre de care are nevoie și mută indicatorul stivei în consecință Nu este nevoie să salvați conținutul acestor registre la intrare și să le restaurați la ieșire, deși dacă o procedură trebuie să modifice un registru static, trebuie mai întâi să-l salveze în mod explicit la valoarea anterioară și ulterior să-l restabilească Deoarece numărul de registre este exprimat printr-o variabilă disponibilă și este determinat de cerințele fiecărei proceduri particulare, utilizarea ineficientă a registrelor este eliminată În plus, adâncimea maximă a unui apel de procedură este mărită, la care registrele nu trebuie să fie „transformate” în memorie Itanium are de registre în virgulă mobilă organizate conform standardului IEEE și nestivuite Un număr mare de registre de acest tip vă permite să stocați rezultatele intermediare ale multor operații cu virgulă mobilă în registre fără a le muta în memorie În plus, Itanium oferă de registre de predicate de bit, registre de salt și de registre de aplicații specializate care sunt utilizate pentru o varietate de scopuri, cum ar fi schimbul de parametri între programele de aplicație și sistemul de operare Schema generală a registrelor Itanium este prezentată în fig de registre în virgulă mobilă de registre de predicate de bit registre generale de registre utilizate ca stivă de registre de registre statice registre aplicate registre de tranziție Orez Itanium registre Planificarea echipei Una dintre cele mai grave neajunsuri ale Cope I este dificultatea de a programa instrucțiuni pentru procesare în diferite blocuri funcționale fără interdependențe Pentru a rezolva această problemă în timpul execuției, sunt implicate mecanisme foarte complexe, al căror suport hardware necesită mult spațiu pe cip În arhitectura IA- și implementarea acesteia - Itanium - aceste probleme sunt rezolvate prin transmiterea funcțiilor corespunzătoare la compilator Fiecare program constă acum dintr-o secvență de grupuri de instrucțiuni Comenzile din cadrul aceluiași grup nu intră în conflict între ele, nu consumă mai multe resurse și nu se referă la mai multe blocuri funcționale, decât cele furnizate de sistem nu formează interdependențe RAW și WAW (interdependențele WAR sunt permise într-o măsură limitată) Se pare că grupurile succesive de instrucțiuni sunt executate strict în ordine, deși, de fapt, dacă este sigur, procesorul poate rula o parte din instrucțiunile grupului următor înainte de finalizarea celui precedent Astfel, procesorul poate programa execuția instrucțiunilor în cadrul fiecărui grup individual în orice ordine, dacă este posibil, în mod paralel În acest caz, probabilitatea de conflicte între echipe este zero Dacă un grup de comenzi încalcă regulile de mai sus, comportamentul programului devine nedefinit Într-o astfel de situație, responsabilitatea de a se asigura că codul de asamblare obținut din programul sursă respectă toate cerințele revine compilatorului Pentru a accelera compilarea în timpul depanării unui program, compilatorul poate plasa fiecare comandă într-un grup separat; acest lucru este simplu de făcut, dar performanța este degradată ca urmare a acestei operațiuni În procesul de generare a versiunii finale a codului, compilatorul petrece o cantitate semnificativă de timp optimizându-l Comenzile sunt combinate în pachete de de biți, ca cel prezentat în partea de sus a Fig Fiecare pachet conține trei instrucțiuni pe de biți și un model de biți Numărul de fascicule dintr-un grup de comenzi nu este întotdeauna exprimat ca un întreg - în unele cazuri, grupurile încep și se termină în mijlocul fasciculelor biți biți Grup de operații registrul de predicate Orez Fasciculul din arhitectura IA- este format din trei comenzi Există peste de formate de comandă Pe fig arată cel mai comun format În acest caz, este folosit pentru a efectua operația ADD cu ALU, care plasează suma a două registre în al treilea Câmpul grup de operații definește clasa generală a instrucțiunii (de exemplu, operația ALU cu numere întregi) Câmpul tip tranzacție indică tranzacția specifică (de exemplu, ADD sau SUB) Urmează trei câmpuri de înregistrare Ultimul câmp al acestui format, câmpul registrului de predicate, va fi discutat puțin mai târziu Șablonul de pachet indică ce blocuri funcționale sunt necesare pentru a-l procesa și, de asemenea, determină poziția limitei grupului de instrucțiuni (dacă există) Principalele blocuri funcționale sunt instrucțiuni ALU întregi și non-întregi, accesări la memorie, operații în virgulă mobilă, tranziții etc Evident, cu șase blocuri și trei instrucțiuni pentru ortogonalitate completă, sunt necesare combinații de bază plus x combinații suplimentare pentru a defini marcatorii de grup după instrucțiunile , și Deoarece sunt disponibili doar biți, sunt permise doar câteva dintre varietatea de combinații Pe de altă parte, dacă trei instrucțiuni în virgulă mobilă ar putea fi incluse în pachet simultan, procesorul pur și simplu nu le-ar putea rula simultan Astfel, sunt considerate valide numai combinațiile efectiv fezabile Reducerea numărului de salturi condiționate - predicție O altă caracteristică a arhitecturii IA- este un nou mod de a gestiona salturile condiționate Dacă ar fi posibil să scăpăm de majoritatea, procesorul ar fi mult mai simplu și ar rula mult mai rapid La prima vedere, ar putea părea imposibil să eliminați salturile condiționate, deoarece programele sunt întotdeauna pline de instrucțiuni if Cu toate acestea, arhitectura IA- și ( folosește o tehnologie specială numită predicare, care poate reduce foarte mult numărul lor [August et al , ; Hwu, Să descriem pe scurt această tehnologie În mașinile de astăzi, toate instrucțiunile sunt necondiționate în sensul că atunci când CPU întâlnește o instrucțiune, pur și simplu o execută Aici întrebarea nu este niciodată rezolvată: „A performa sau a nu face?” Dimpotrivă, într-o arhitectură de predicat, comenzile conțin condiții care vă spun când să executați comanda și când nu Această tranziție de la comenzile necondiționate la comenzile predicate este cea care ne permite să scăpăm de multe salturi condiționate În loc să alegeți una sau alta secvență de comenzi necondiționate, toate comenzile sunt îmbinate într-o singură secvență de comenzi predicate, în care diferite comenzi au predicate diferite Pentru a înțelege cum funcționează predicția, luați în considerare un exemplu simplu (listele - ) care arată execuția condiționată a comenzilor (execuția condiționată este precursorul predicației) În Lista , vedem o declarație if În Listarea , după ce a fost tradus, au existat trei comenzi: comparați, săriți și mutați În Lista - , am scăpat de saltul condiționat folosind noua instrucțiune CMOVZ, care este o instrucțiune de mutare condiționată Această instrucțiune verifică dacă al treilea registru R este egal cu zero Dacă este egală, atunci comanda copiază R în R , iar dacă nu, comanda nu face nimic Lista declarația dacă dacă (R == ) R = R ; Lista Cod de asamblare pentru listare CMP R , BNE L MOV R , R LI: Lista Comanda condiționată CMOVZ R ,R ,R ■ /■«■a /rivona arhitectura naoora comenzi Dacă avem o instrucțiune care poate copia date atunci când orice registru este zero, atunci putem avea și o instrucțiune care copiază datele dacă orice registru nu este zero Să fie aceasta comanda CMOVN Cu ambele comenzi la locul lor, suntem deja pe drumul spre execuția completă condiționată Imaginați-vă o instrucțiune if cu mai multe instrucțiuni de atribuire în partea apoi și mai multe instrucțiuni de atribuire în partea else Acest întreg fragment de program poate fi tradus în cod care va seta un registru la dacă condiția nu este îndeplinită și la o altă valoare dacă condiția este îndeplinită Astfel, asignările din partea apoi pot fi compilate într-o secvență de instrucțiuni CMOVN, iar atribuirile din partea else pot fi compilate într-o secvență de instrucțiuni CMOVZ Toate aceste instrucțiuni, inclusiv instrucțiunile setului de registre, CNOVN și CMOVZ, formează un singur bloc principal fără salturi condiționate Comenzile pot fi chiar reordonate în timpul compilării sau în timpul executării Singura cerință este ca condiția să fie cunoscută până în momentul în care instrucțiunile condiționate trebuie să fie plasate în registrele de ieșire (adică undeva la capătul conductei) Un exemplu simplu de fragment de program cu instrucțiuni then și else este prezentat în Listările - Lista operator ȘI dacă(R == ) { R = R ; R =R ; } altfel { R =R ; R =R ; } Lista Cod de asamblare pentru Lista SIR R BNE L MOV-R ,R MOV R ,R BR L LI: MOV-R ,R MOV-R ,R L : Lista Execuție condiționată CMOVZ R ,R ,R CMOVZ R ,R ,R CMOVN-R ,R ,R CMOVN-R ,R ,R Am arătat doar instrucțiuni condiționale foarte simple (luate din arhitectura de instrucțiuni IA- ), dar în arhitectura IA- toate instrucțiunile sunt predicate Aceasta înseamnă că execuția fiecărei comenzi poate fi condiționată Câmpul suplimentar pentru Registrul de predicați pe biți pe care l-am menționat vă permite să selectați unul dintre cele de registre de predicate pe biți Prin urmare, instrucțiunea if poate fi compilată într-un cod care setează unul dintre registrele de predicat la dacă condiția este adevărată și la dacă condiția este falsă Celălalt caz predicat este inversat simultan și automat Astfel, la Arhitectura IA- si procesor Itanium g suport pentru predicție, instrucțiunile de mașină care sunt formate din instrucțiunile then și else se îmbină într-un singur flux de instrucțiuni, iar instrucțiunile primei dintre ele au un câmp de registru de predicate care se dovedește a fi unul, iar cel al celui de-al doilea este zero Când controlul este transferat, va fi executat un singur set de instrucțiuni Listările - arată cum este folosită predicția pentru a elimina tranzițiile Instrucțiunea CMPEQ compară două registre și setează registrul predicat P la dacă acestea sunt egale și la dacă nu sunt egale În plus, comanda inversează un alt registru, cum ar fi P Aceste comenzi if and then part pot fi plasate una după alta, fiecare dintre ele fiind asociată cu un anumit predicat (cazul indicat în paranteze) Orice cod poate fi plasat aici, atâta timp cât fiecare comandă este prezisă corect Lista operator ȘI dacă(Rl == R ) R = R + R ; Altfel R = R - R Lista Cod de asamblare pentru Lista SIR R R BNE L MOV-R ,R ADAUGĂ R ,R BR L LI: MOV R ,R SUB R jR L : Lista Execuția predicată CMPEQ Rl,R jP ADD R ,R ,R SUB R ,R ,R În arhitectura IA- , această idee este adusă la concluzia sa logică - aici comenzile de comparație, comenzile aritmetice și unele alte comenzi sunt asociate cu registrele de predicate Instrucțiunile predicate pot fi plasate secvenţial în conductă, fără probleme sau timpi de nefuncţionare Prin urmare, sunt foarte utile În arhitectura IA- , predicția are loc după cum urmează Fiecare instrucțiune este de fapt executată, iar la sfârșitul conductei, când este deja necesară stocarea rezultatului în registrul de ieșire, se verifică dacă predicția este adevărată Dacă da, rezultatele sunt pur și simplu scrise în registrul de ieșire Dacă predicția este falsă, atunci registrul de ieșire nu este scris Puteți citi mai multe despre predicție în literatura suplimentară [Dulong, ] Încărcare speculativă O altă caracteristică a IA- care îmbunătățește performanța este suportul pentru încărcare speculativă Dacă instrucțiunea speculativă LOAD eșuează, în loc să arunce o excepție, pur și simplu se oprește din execuție și raportează că registrul în care trebuia să fie încărcat este invalid Pentru - comenzi ursh pviirp Acesta folosește același bit otravă pe care l-am menționat în capitolul Și o excepție va fi aruncată numai dacă apoi încercați să utilizați acel registru De obicei, la încărcarea speculativă, compilatorul plasează comenzi LOAD înaintea altor comenzi Deoarece aceste comenzi încep să se execute mai devreme decât ar trebui, ele se pot finaliza înainte ca rezultatele să fie necesare În locul în care trebuie să obțină valoarea unui anumit registru, compilatorul introduce comanda SNECK Dacă valoarea este deja acolo, comanda CHESK funcționează la fel ca NOP, iar execuția programului continuă imediat Dacă încă nu există nicio valoare în registru, următoarea instrucțiune este forțată să fie inactivă În concluzie, putem spune că în mașinile cu arhitectura IA- sunt implementate mai multe mecanisme de creștere a performanței În primul rând, este o mașină RISC modernă, canalizată, cu trei adrese, care acceptă un mecanism de încărcare/stocare Numai acest factor reprezintă o îmbunătățire semnificativă față de complexitatea excesivă a arhitecturii IA- În al doilea rând, IA- acceptă modelul de paralelism explicit Compilatorul determină ce comenzi pot fi executate în același timp și, fără conflict, grupează aceste comenzi în pachete Astfel, procesorul poate programa pur și simplu procesarea fasciculelor fără să se gândească la vreo verificare Mutarea lucrării de la runtime la compilare este întotdeauna eficientă În al treilea rând, predicția vă permite să combinați comenzile ambelor salturi într-o declarație if, eliminând atât saltul condiționat, cât și necesitatea de a prezice acel salt În cele din urmă, încărcarea speculativă permite apelarea operanzilor înainte de timp și, chiar dacă mai târziu se dovedește că acești operanzi nu sunt necesari, nu se va întâmpla nimic rău Una peste alta, arhitectura Itanium este bine gândită și în interesul designerilor și utilizatorilor Deci, procesorul Itanium rulează pe computerul tău sau pe cel al vecinului tău? Răspunsul este nu, nu și din nou (cel mai probabil) nu Astăzi, la mai bine de ani de la lansarea procesorului Itanium, popularitatea sa poate fi descrisă în cel mai bun caz ca fiind moderată Dar Intel continuă să producă sisteme bazate pe Itanium, deși limitate la servere de înaltă performanță Deci, să revenim la problemele originale care au dus la crearea arhitecturii IA- Procesorul Itanium a fost creat pentru a corecta deficiențele arhitecturii IA- Deoarece nu este utilizat pe scară largă, cum rezolvă Intel aceste probleme? După cum va fi arătat în Capitolul , dezvoltarea IA- nu se bazează pe o reproiectare a arhitecturii setului de instrucțiuni, ci pe implementarea activă a calculului paralel bazat pe arhitecturi multiprocesor Pentru mai multe informații despre procesorul Itanium și microarhitectura acestuia, a se vedea literatura suplimentară [McNairy și Soltis, ; Rusu et al , ] Rezumatul capitolului Pentru majoritatea oamenilor, nivelul de arhitectură al setului de instrucțiuni este „limbajul mașinii”, deși pe computerele CISC este de obicei construit peste nivelul inferior nivel de microcod La acest nivel, aparatul are memorie de octeți sau de cuvinte de câteva zeci de megaocteți și conține instrucțiuni precum MOVE, ADD și BEQ În majoritatea computerelor moderne, memoria este organizată ca o secvență de octeți, cu sau octeți grupați în cuvinte De obicei, o mașină are între și de registre, fiecare conținând un cuvânt În unele mașini (de exemplu, în Cori ) atunci când se accesează cuvinte de memorie, alinierea de-a lungul limitelor naturale ale celulelor nu este necesară, în altele (de exemplu, în OMAP ) aceasta este o condiție obligatorie Cu toate acestea, chiar dacă alinierea nu este o condiție prealabilă, operațiunile sunt mai rapide cu ea Instrucțiunile au de obicei , sau operanzi, care sunt accesați folosind diverse moduri de adresare: imediat, direct, registru, index și așa mai departe Unele mașini acceptă un set extins de moduri complexe de adresare Destul de des, compilatorii nu pot folosi aceste moduri în mod eficient Instrucțiunile pot de obicei să mute date, să efectueze operații unare și binare (inclusiv operații aritmetice și logice), ramuri, proceduri de apel, să efectueze bucle și, uneori, unele I/O Instrucțiunile tipice mută un cuvânt din memorie într-un registru sau invers, se adună, se scad, se înmulțesc sau se împart două registre sau un registru și un cuvânt din memorie sau se compară două valori în registre sau memorie Destul de des, numărul de instrucțiuni din computere depășește În procesoarele CISC, există și mai multe Pentru a transfera controlul la nivelul arhitecturii instrucțiunilor, sunt utilizate diverse primitive: sărituri, proceduri de apelare și coroutine, captarea excepțiilor și gestionarea întreruperilor Salturile sunt necesare pentru a opri o secvență de instrucțiuni și a începe una nouă (poate aflată în memorie la o distanță considerabilă de prima) Procedurile vă permit să selectați un fragment al programului, care poate fi apoi apelat din diferite locuri din același program Coroutinele permit două fire de control să ruleze în paralel Captarea excepțiilor este utilizată pentru a semnala situații excepționale (de exemplu, o depășire) Mecanismul de întrerupere face posibilă efectuarea I/O în paralel cu calculele principale, în timp ce de îndată ce I/O este finalizată, procesorul central primește un semnal despre acesta Problema Turnului din Hanoi poate fi rezolvată folosind recursiunea Există, de asemenea, soluții* bazate pe iterație, dar sunt mult mai complexe* și mai puțin elegante decât soluția recursivă la care ne-am uitat În cele din urmă, arhitectura IA- utilizează modelul de calcul EPIC, care simplifică implementarea paralelismului în programe Pentru a îmbunătăți performanța, această arhitectură asigură gruparea instrucțiunilor, predicția și încărcarea speculativă Arhitectura IA- poate fi un bun înlocuitor pentru Coge i , chiar dacă impune o sarcină grea compilatorului în ceea ce privește menținerea paralelismului Cu toate acestea, lucrul în etapa de compilare este întotdeauna de preferat decât să o faci în timpul execuției Întrebări și sarcini Un cuvânt dintr-un sistem big endian i se atribuie valoarea numerică Să presupunem că acest cuvânt este transferat octet cu octet și stocat într-un sistem big endian, cu octetul sursă corespunzând octetului destinație și așa mai departe valoarea numerică a unui cuvânt într-un sistem big-endian? Anterior, multe sisteme de operare și calculatoare utilizau spații separate de instrucțiuni și date, astfel încât o adresă de ^-bit putea reprezenta până la k adrese de program și k adrese de date De exemplu, pentru k = , programul ar putea accesa GB de instrucțiuni și GB de date; cantitatea totală de spațiu de adrese a ajuns la GB Deoarece un program nu se poate modifica în memorie folosind această schemă, cum ar putea sistemul de operare să aranjeze ca programele să fie încărcate în memorie? Dezvoltați un cod operațional extins care vă permite să codificați următoarele într-o instrucțiune pe de biți: • comenzi cu două adrese de biți și număr de registru de biți; • de comenzi cu o adresă de biți și număr de registru de biți; • de comenzi fără adrese și registre Lăsați mașina să accepte comenzi pe biți și adrese pe biți Unele comenzi conțin o adresă, altele două Dacă există n instrucțiuni cu două adrese, care este numărul maxim de instrucțiuni cu o singură adresă? Este posibil să se dezvolte un astfel de cod operațional extins care să permită codificarea următoarelor într-o instrucțiune de biți (un registru este reprezentat de biți): • comenzi cu trei registre; • de comenzi cu un singur registru; • comenzi fără registre Să existe o mașină unicast cu un registru de adunare Iată valorile câteva cuvinte de amintire: • cuvântul conţine numărul ; • cuvântul conține numărul ; • cuvântul conţine numărul ; • cuvântul conţine numărul ; Ce valori se vor încărca următoarele comenzi în registrul totalizatorului? ÎNCĂRCARE IMMEDIATĂ ÎNCĂRCARE DIRECT ÎNCĂRCARE INDIRECTA ÎNCĂRCARE IMMEDIATĂ ÎNCĂRCARE DIRECT ÎNCĂRCARE INDIRECTA Pentru fiecare dintre cele patru tipuri de mașini - non-adresă, uni-adresă, cu două adrese și trei adrese, scrieți un program pentru calcularea următoarei expresii: X = (A + B x C) / (D - E x F) Următoarele comenzi sunt disponibile • fără adresă: PUSH L/, POP Af, ADD, SUB, MUL, DIV; • unicast: LOAD Af, STORE Af, ADD Af, SUB Af, MUL Af, DIV Af; • adresa dubla: MOV (X = Y), ADD (X = X + Y), SUB (X = X - Y), mul (X = X x Y), div (X = X/Y); • cu trei adrese: MOV (X = Y), ADD (X = Y + Z), SUB (X = Y - Z), mul (X = Y x Z), div (X = Y / Z) Aici M este o adresă de memorie de biți, iar X, Y și Z sunt fie adrese de biți, fie registre de biți Mașina neadresată folosește o stivă, mașina unicast folosește un registru de acumulator, iar celelalte două au registre și instrucțiuni care funcționează pe toate combinațiile de locații și registre de memorie Instrucțiunea SUB XjY scade Y din X, iar instrucțiunea SUB X YjZ scade Z din Y și pune rezultatul în X Dacă opcode-urile sunt lungi de biți și dimensiunile instrucțiunilor sunt multipli de biți, de câți biți trebuie să fie fiecare mașină calculeaza X? Veniți cu un mecanism de adresare care vă permite să definiți un set arbitrar de de adrese într-un câmp de biți, nu neapărat adiacent Care este dezavantajul programelor automodificatoare care nu a fost menționat în textul acestui capitol? Schimbați următoarele formule de la notația infixă la notația poloneză inversă: ) A + B + C + DE- ) (L + B) x (C + D) + £; ) (A x B) + (C x D) + E; ) (L - B) x (((C - D x E) / F) / G) x H Care dintre următoarele perechi de formule cu notație polarizată inversă sunt echivalente din punct de vedere matematic? ) AB + C + și ABC ++; ) AB-C-iABC ; ) A B x C + și A B C + X Convertiți următoarele formule din notație poloneză inversă în notație infixă: m|*pg vn i pniiro KUIVIUN^ț Scrieți trei formule în notație poloneză inversă care nu pot fi convertite în notație infixă Convertiți următoarele formule logice infixe la notația poloneză inversă: ) (A ȘI B) SAU C; ) (L SAU V) ȘI (L SAU S); ) (L ȘI B) SAU (C ȘI D) Schimbați următoarea formulă infixă pentru a inversa notația poloneză și scrieți codul IJVM pentru a o executa: ( x + ) - ( / + ) Câte registre sunt în aparat, ale căror formate de comandă sunt prezentate în fig ? În formatele de comandă din fig Opțiunile de format și se disting prin bitul Cu toate acestea, nu este furnizat niciun bit special pentru a defini opțiunea de format De unde știe hardware-ul că este necesară opțiunea ? În programare, se întâlnește adesea problema verificării dacă o variabilă X aparține intervalului de la A la B Dacă ar exista o instrucțiune cu trei adrese cu operanzi A, B și X, câți biți din codul de condiție ar fi setați de această instrucțiune? Descrieți un avantaj și un dezavantaj al mecanismului de adresare în ceea ce privește contorul de programe Cogei conține un bit de cod de condiție, a cărui stare depinde de transportul bitului după ce a fost efectuată o operație aritmetică De ce este nevoie de asta? Unul dintre prietenii tai bate la usa ta la ora dimineata si anunta bucuros ca a avut o idee grozava - sa creeze o echipa cu doua coduri de operare Ce vei face în această situație, să-ți trimiți prietenul să obțină un brevet sau să-i trimiți (gândește-te mai departe)? Următoarele forme de verificare sunt foarte frecvente în programare: dacă (k== ) dacă (a>b) dacă (k Adresă MULTICS compusă Orez Conversia unei adrese compuse MULTICS într-o adresă de memorie principală memorie virtuală Coge i Coge i are un sistem de memorie virtuală sofisticat care acceptă paginarea la cerere, segmentarea pură și segmentarea paginare Memoria virtuală este formată din două tabele: LDT (Local Descriptor Table) și GDT (Global Descriptor Table) Fiecare program are propriul său tabel de descriptor local și un singur tabel de descriptor global este partajat de toate programele de pe computer Tabelul descriptor local descrie segmentele locale ale fiecărui program (codul său, datele, stiva, etc ), în timp ce tabelul descriptor global descrie segmentele de sistem, inclusiv sistemul de operare însuși După cum sa menționat în capitolul , pentru a accesa un segment, Core i încarcă mai întâi selectorul de segment într-unul dintre registrele de segment Pe parcursul execuția programului, registrul CS conține selectorul de segment de cod, selectorul de segment de date DS și așa mai departe Fiecare selector este un număr de biți (Figura ) biți INDEX O—GDT -LDT Nivel de privilegii ( - ) Orez Selector Core i Unul dintre biții de selecție indică dacă segmentul este local sau global (adică căruia dintre cele două tabele de descriptori, local sau global, îi aparține) Alți biți determină numărul unui element din tabelul descriptor local sau global, astfel încât fiecare dintre aceste tabele este limitat la descriptori de segment de KB ( ) Cei doi biți rămași sunt legați de protecție Le vom descrie mai târziu Descriptorul este invalid și aruncă o excepție Poate fi încărcat în registrul de segment pentru a indica faptul că registrul de segment nu este disponibil, dar dacă încercați să utilizați mânerul , va fi aruncată o excepție Când un selector este încărcat într-un registru de segment, descriptorul corespunzător este apelat din tabelul de descriptor local sau global și stocat în registrele interne ale managerului de memorie, astfel încât să poată fi accesat rapid Descriptorul este format din octeți Aceasta include adresa de bază a segmentului, dimensiunea acestuia și alte informații (Figura ) ruda de biți BAZĂ - LIMITĂ adresa BAZĂ - HG LIMITA - R DPL BAZĂ - - câmp LIMIT în octeți i— Tipul segmentului și protecția - Câmp LIMIT în pagini Segment de - biți Nivel de privilegii ( - ) - segment nu este în memorie - segment prezent în memorie - segment pe de biți Orez Descriptor de segment de cod pentru COGE i Segmentele de date sunt practic aceleași Formatul selectorului este ales astfel încât să simplifice căutarea descriptorului Mai întâi, pe baza bitului din selector, este selectat tabelul de descriptor local sau global Selectorul este apoi copiat în registrul de gestionare a memoriei temporare, iar cei mai puțin semnificativi trei biți sunt setați la , ceea ce înmulțește numărul de biți al selectorului cu În cele din urmă, adresa din tabelul de descriptor local sau global (care Capitolul Nivelul sistemului de operare stocate în registrele interne ale managerului de memorie), iar rezultatul este un pointer către mâner De exemplu, selectorul se referă la elementul din tabelul de descriptor global, care se află în adresa celulei GDT + Să vedem cum perechea (selector, offset) se transformă într-o adresă fizică Odată ce hardware-ul determină ce registru de segment este utilizat, caută descriptorul complet corespunzător acelui selector în registrele interne Dacă un astfel de segment nu există (selector ) sau nu se află în prezent în memorie (P = ), se aruncă o excepție În primul caz, aceasta este o eroare de software; al doilea caz necesită ca sistemul de operare să apeleze segmentul dorit Hardware-ul verifică apoi dacă offset-ul este în afara segmentului Dacă iese, excepția este ridicată din nou În mod logic, descriptorul ar trebui să aibă un câmp de de biți pentru a defini dimensiunea segmentului, dar există doar de biți disponibili, deci în acest caz se folosește o schemă complet diferită Dacă câmpul G (Granularitate - granularitate) este , atunci câmpul LIMIT (valoare maximă) oferă dimensiunea exactă a segmentului (până la MB) Dacă câmpul G este , atunci câmpul LIMIT specifică dimensiunea segmentului în pagini, nu în octeți Dimensiunea paginii pe un computer Coge i nu este niciodată mai mică de KB, deci de biți sunt suficienti pentru segmente de până la de octeți Dacă segmentul este în memorie și offset-ul se află în limita segmentului, Coré I adaugă câmpul BASE de de biți (adresă de bază) din descriptor la offset, rezultând o adresă liniară (Figura ) Câmpul BASE este împărțit în trei părți și răspândit pe descriptor pentru a asigura compatibilitatea cu procesorul , care are o dimensiune BASE de doar de biți Prin urmare, fiecare segment poate începe oriunde în spațiul de adrese de de biți Orez Conversia unei perechi selector-offset într-o adresă liniară Dacă paginarea este dezactivată (determinată de un bit din registrul de control global), adresa liniară este interpretată ca o adresă fizică și trimisă în memorie pentru citire sau scriere Astfel, cu blocarea paginației, avem o schemă de segmentare „pură”, în care adresa de bază a fiecărui segment este prezentă în descriptorul său Segmentele suprapuse sunt permise, deoarece ar fi prea plictisitor să petreci mult timp verificând dacă segmentele nu se suprapun Memorie virtuala Dacă paginarea este activată, adresa liniară este interpretată ca o adresă virtuală și mapată la o adresă fizică folosind tabele de pagini, la fel ca exemplele noastre Singura dificultate este că, cu o adresă virtuală de de biți și pagini de de biți, un segment K poate conține un milion de pagini, astfel încât maparea pe două niveluri este utilizată pentru a reduce dimensiunea tabelului de pagini pentru segmente mici Fiecare program care rulează are un tabel special de pagini care constă din de intrări pe de biți Adresa sa este specificată de registrul global Fiecare intrare din acest tabel indică un tabel de pagină care conține, de asemenea, de intrări pe de biți Intrările din tabelul paginii indică cadrele de pagină Schema este prezentată în fig Adresă liniară Biți g DIR PAGINA OFF A Directorul paginii Tabelul paginii cadru de pagină DR Cuvânt ales Orez Maparea liniară cu adresa fizică Pe fig În Figura , vedem o adresă liniară împărțită în trei câmpuri: DIR, PAGI* și OFE Câmpul DIR este folosit ca index în directorul paginii pentru a găsi un pointer către tabelul de pagini dorit Câmpul PAGE este un index în tabelul paginii când se găsește adresa fizică a cadrului de pagină În cele din urmă, câmpul OFF este adăugat la adresa cadrului paginii pentru a forma adresa fizică a octetului sau cuvântului dorit Dimensiunea fiecărei intrări în tabelul paginii este de de biți, dintre care conțin numărul cadrului paginii Biții rămași includ bitul de acces și bitul de modificare care sunt setate de hardware pentru a ajuta sistemul de operare, biții de securitate și alții Fiecare tabel de pagini conține intrări pentru de cadre de pagină de KB fiecare, astfel încât un tabel de pagini poate gestiona MB de memorie Un segment mai scurt de MB va avea un director de pagini cu o singură intrare (un pointer către tabelul său cu o singură pagină) Astfel, supraîncărcarea pentru segmentele scurte este de numai două pagini, mai degrabă decât un milion de pagini, așa cum ar fi cazul unui tabel de pagini cu un singur nivel Pentru a evita accesele repetate la memorie, managerul de memorie Coge I are suport hardware încorporat pentru găsirea combinațiilor de câmpuri DIR-PAGE utilizate recent și maparea lor la adresa fizică a cadrului de pagină corespunzător Acțiunile prezentate în fig sunt executate numai dacă combinația curentă a fost folosită mult timp În paginare, valoarea câmpului BASE din descriptor poate fi nulă Singurul lucru de care are nevoie câmpul BASE este să obțină o decalare ușoară, astfel încât să folosească elementul din mijloc, mai degrabă decât la începutul directorului paginii Câmpul BASE este inclus în descriptor doar pentru a implementa segmentarea pură (fără paginare) și, de asemenea, pentru compatibilitatea cu vechiul procesor care nu avea paginare Rețineți că dacă o anumită aplicație nu are nevoie de segmentare și se mulțumește cu un singur spațiu de adrese de paginare de de biți, acest lucru este ușor de realizat Toate registrele de segmente pot fi completate cu același selector, al cărui descriptor conține un câmp BASE nul și un câmp LIMIT maxim Offset-ul instrucțiunii va fi apoi o adresă liniară cu un singur spațiu de adresă, care este în esență paginarea tradițională Aceasta încheie considerația noastră asupra organizării memoriei virtuale în Core I Ne-am uitat la subsistemul de memorie virtuală Coré i mic (dar folosit în mod obișnuit); cititorul curios poate consulta documentația Coge I pentru informații despre extensiile de adresare pe de biți și suport pentru spațiile de adrese fizice virtualizate Cu toate acestea, în concluzie, merită să spunem câteva cuvinte despre protecție, deoarece aceasta este direct legată de memoria virtuală Coge i acceptă niveluri de protecție, unde nivelul este cel mai privilegiat și nivelul este cel mai puțin privilegiat (Figura ) Nivelul de protecție al unui program care rulează este indicat de un câmp de biți în Program Status Word (PSW), un registru hardware care conține coduri de stare Posibili utilizatori de diferite niveluri Woweven Orez Niveluri de protecție pentru procesorul Coge i și alți biți de stare În plus, nu numai programele, ci fiecare segment și sistem au un anumit nivel de protecție Atâta timp cât programul folosește doar propriile segmente de nivel, totul este în regulă Accesul la date de nivel superior este permis Accesul la datele de nivel inferior este interzis - în acest caz, apare o excepție Putem apela proceduri atât de nivel superior, cât și de nivel inferior, dar trebuie să controlăm cu strictețe situația Pentru a apela o procedură la un alt nivel, comanda CALL trebuie să conțină un selector în loc de o adresă Acest selector indică un mâner numit poarta de apel (caii gate) care poate fi folosit pentru a obține adresa procedurii dorite Astfel, este imposibil să faci o tranziție la mijlocul unui segment arbitrar la un alt nivel Pot fi folosite doar punctele de intrare oficiale Uită-te la fig La nivelul , vedem nucleul sistemului de operare, care controlează procesul I/O, funcționarea memoriei etc La nivelul , există un handler de apel de sistem Programele utilizator pot apela proceduri de la acest nivel, dar acestea sunt proceduri strict definite Nivelul conține rutine de bibliotecă care pot fi partajate între mai multe programe care rulează Programele utilizator pot apela aceste proceduri, dar nu le pot modifica La nivelul funcționează programele utilizator, care au cel mai scăzut grad de protecție Sistemul de protecție Core I , ca și schema de gestionare a memoriei, se bazează în general pe principiile sistemului MULTICS Excepțiile și întreruperile folosesc un mecanism similar Excepțiile și întreruperile se referă și la mânere, nu la adrese absolute, iar aceste mânere indică proceduri care trebuie executate Câmpul TYPE din fig vă permite să distingeți între segmente de cod, segmente de date și diferite elemente logice Memorie virtuală OMAP OMAP este o mașină pe de biți care acceptă memorie virtuală paginată bazată pe adrese de de biți mapate la un spațiu de adrese fizice de de biți În consecință, un procesor ARM poate suporta până la ( GB) de memorie fizică Sunt acceptate patru dimensiuni de pagină: KB, KB, MB și MB Mecanismul de afișare pentru aceste patru dimensiuni de pagină este prezentat în Fig Biți Adresă virtuală Adresă virtuală K de Offset K rad virtual Offset M rad virtual Offset M rad virtual Părtinire Adresă fizică KB cadru de pagină Offset KB cadru de pagină Offset MB cadru de pagină Offset MB cadru de pagină Offset Biți Orez Maparea adreselor virtuale cu cele fizice în OMAP Structura tabelelor de pagini OMAP este foarte asemănătoare cu cea a lui Coré i Mecanismul de mapare pentru pagini K este prezentat în Figura a Tabelul descriptor al primului nivel este indexat de cei biți superiori ai adresei virtuale Intrarea tabelului de descriptori de primul nivel specifică adresa fizică a tabelului de descriptori de al doilea nivel Această adresă, combinată cu următorii biți ai adresei virtuale, formează adresa descriptorului de pagină Descriptorul de pagină conține adresa cadrului paginii fizice și informații care definesc drepturile de acces la pagină Motorul de memorie virtuală OMAP acceptă patru dimensiuni de pagină Paginile cu dimensiuni de MB și MB sunt mapate la descriptori de pagină din tabelul de descriptori de primul nivel Nu este nevoie de tabele de al doilea nivel în acest caz, deoarece toate elementele indică o pagină fizică mare Descriptorii pentru K pagini sunt în tabelul de nivel al doilea Deoarece fiecare intrare din tabelul de descriptor de nivel al doilea mapează o pagină virtuală de kiloocteți la o pagină fizică de kiloocteți, pentru o pagină de de KB, trebuie să existe descriptori identici în tabelul de descriptori de al doilea nivel De ce un programator sănătos de operare ar declara o pagină de K când pot fi folosite pagini K mai flexibile? Pentru că, după cum vom vedea în curând, paginile de KB necesită mai puține intrări TLB, iar această resursă este esențială pentru o performanță bună Nimic nu încetinește un program mai mult decât blocajele de memorie Privind cu atenție Fig În Figura , veți vedea că fiecare acces la memoria programului necesită două accesări suplimentare la memorie pentru a rezolva adresa Costul suplimentar de % pe memorie de acces necesar pentru a traduce adrese virtuale poate încetini orice program Pentru a elimina acest factor, OMAP folosește așa-numitul buffer de conversie rapidă Tabel de pagini (cautat de managerul de memorie pe ratari TLB) TLB (hardware manager de memorie) A b Orez Structuri de date utilizate pentru a traduce adresa virtuală SMAP : tabelul de traducere a adreselor (a); tampon TSB (b) memorie virtuala nume (Translation Lookaside Buffcr, TLB) pentru conversia rapidă a numerelor de pagină virtuală și a numerelor de cadru de pagină fizică Pentru pagini de KB, există de numere de pagini virtuale, peste un milion Desigur, nu toate pot fi afișate TLB stochează numai numerele paginilor virtuale care au fost utilizate ultima dată Paginile de comandă și datele sunt tratate separat Pentru fiecare dintre aceste categorii, TLB include cele mai recente de numere de pagină Fiecare intrare TLB include un număr de pagină virtuală și numărul său de cadru fizic al paginii Când un număr de proces, numit ASID (Address Space Identifier) și o adresă virtuală sunt transmise managerului de memorie, managerul, folosind o schemă specială, compară simultan numărul de pagină virtuală cu toate elementele bufferului TLB pentru un anumit context deodată Dacă se găsește o potrivire, numărul cadrului de pagină din intrarea respectivă în buffer este concatenat cu offset-ul luat de la adresa virtuală pentru a obține o adresă fizică de de biți și unele steaguri (cum ar fi biții de securitate) Bufferul rapid de traducere a adresei este prezentat în Fig , Dacă nu se găsește nicio potrivire, adică există o pierdere TLB (asemănătoare cu o pierdere de cache), are loc o enumerare hardware a tabelelor de pagini Când o nouă intrare de descriptor de pagină fizică este găsită în tabelul de pagini, aceasta este verificată pentru a vedea dacă pagina este în memorie, iar dacă verificarea este pozitivă, traducerea adresei corespunzătoare este încărcată în TLB Dacă pagina nu este în memorie, apare o eroare standard de pagină Deoarece numărul de intrări în TLB este mic, șansele ca o intrare TLB existentă să fie evacuată sunt mari Apelurile viitoare către pagina preempțiată vor trebui să itereze din nou conținutul tabelelor de pagină pentru a obține maparea adresei Dacă prea multe pagini sunt evacuate prea repede, va avea loc thrashing și majoritatea accesărilor la memorie vor genera o suprasarcină suplimentară de % Este interesant să comparăm organizarea memoriei virtuale în Cor i și OMAP Core I acceptă segmentarea pură, paginarea pură și segmentarea combinată cu paginarea OMAP acceptă numai paginarea Atât Coré I , cât și OMAP reîncarcă elementul buffer TLB în hardware în cazul unei pierderi TLB Alte arhitecturi (cum ar fi SPARC și MIPS) pur și simplu transferă controlul către sistemul de operare Aceste arhitecturi definesc comenzi speciale cu privilegii TLB, astfel încât sistemul de operare să poată efectua căutarea tabelului de pagini și operațiunile de încărcare TLB necesare pentru traducerea adresei Memorie virtuală și cache La prima vedere, poate părea că memoria virtuală și memoria cache nu sunt legate în niciun fel, dar, de fapt, aceste mecanisme sunt similare Cu memoria virtuală, întregul program este stocat pe disc și paginat în pagini de dimensiune fixă O parte din aceste pagini se află în memoria principală Dacă programul folosește în principal pagini din memoria principală, erorile de pagină vor fi rare și programul va putea rula rapid Cu memorarea în cache, întregul program este stocat în memoria principală și împărțit în blocuri de dimensiune fixă Unele subseturi ale acestor blocuri se află în cache Dacă programul utilizează în principal blocuri de cache, atunci erorile de cache vor apărea rar și programul va putea rula rapid După cum puteți vedea, memoria virtuală și memoria cache sunt identice, cu excepția faptului că funcționează la diferite niveluri ale ierarhiei Desigur, memoria virtuală și memoria cache sunt oarecum diferite Erorile de cache sunt gestionate de hardware, în timp ce erorile de pagină sunt gestionate de sistemul de operare Blocurile de cache sunt de obicei mult mai mici decât paginile (comparați de octeți față de KB) În plus, tabelele de pagini sunt indexate de biții înalți ai adresei virtuale, în timp ce memoria cache este indexată de biții de jos ai adresei de memorie Cu toate acestea, este important să înțelegem că diferența aici este doar în implementare, iar la nivel conceptual există o asemănare semnificativă Virtualizare hardware În mod tradițional, arhitecturile hardware au fost proiectate cu așteptarea că un singur sistem de operare rulează pe ele la un moment dat Tehnologiile populare de astăzi pentru partajarea resurselor de calcul (de exemplu, serverele de cloud computing) beneficiază foarte mult de capacitatea de a rula mai multe sisteme de operare simultan De exemplu, furnizorii de servicii de găzduire pe internet oferă de obicei clienților lor acces deplin la sistemul pe care este construit serviciul eb Ar fi prea irositor să instalați un nou computer în camera serverului pentru fiecare client nou În schimb, virtualizarea este de obicei utilizată, permițând mai multor sisteme complete (inclusiv sistemul de operare) să ruleze pe un singur server Numai când sarcina pe serverele existente devine prea mare, se adaugă un nou server fizic la pool-ul de servere Există tehnologii de virtualizare bazate exclusiv pe software, dar de obicei încetinesc sistemul virtual și necesită modificări speciale ale sistemului de operare sau utilizarea unor analizoare de cod complexe pentru a modifica programele în timpul execuției Toate acestea i-au determinat pe designeri să extindă stratul de sistem de operare în arhitecturile lor pentru a sprijini efectiv virtualizarea direct la nivel hardware Virtualizarea hardware (Figura ) este o colecție de instrumente hardware și software care permit mai multor sisteme de operare să ruleze simultan pe un singur computer fizic Din punctul de vedere al utilizatorului final, fiecare mașină virtuală care rulează pe un computer fizic arată ca un sistem de operare independent Hypervisorul, o componentă software care are multe în comun cu nucleul sistemului de operare, este responsabil pentru crearea și gestionarea instanțelor mașinilor virtuale Hardware-ul furnizează evenimentele care sunt vizibile la nivel de software și sunt solicitate de către hypervisor pentru a partaja accesul la procesor, sistemul de stocare și dispozitivele I/O Anexa X Anexa Anexa Anexa Z Anexa W Anexa V Anexa V Anexa Q OSA OSA OS IN OSS Suport hardware pentru mașină virtuală Suport hardware pentru mașină virtuală Suport hardware pentru mașină virtuală Suport hardware pentru mașină virtuală Hypervisor (componenta software) Arhitectura hardware și periferice ale unui computer fizic Orez Suportul hardware pentru virtualizare vă permite să rulați mai multe sisteme de operare simultan pe un singur computer fizic Hypervisorul gestionează partajarea memoriei și a dispozitivelor I/O Având mai multe mașini virtuale care rulează sisteme de operare diferite pe același computer fizic, deschide multe posibilități utile În sistemele de server, virtualizarea permite administratorilor de sistem să creeze mai multe mașini virtuale pe un singur server fizic și să mute mașinile virtuale care rulează între servere pentru o distribuție optimă a încărcăturii totale Mașinile virtuale oferă, de asemenea, mijloacele pentru a controla mai precis accesul la dispozitivele I/O De exemplu, lățimea de bandă a portului de rețea virtualizat poate fi alocată pe baza nivelurilor de servicii ale utilizatorului Virtualizarea permite unui utilizator individual să ruleze mai multe sisteme de operare în același timp Pentru ca virtualizarea să fie implementată în hardware, toate instrucțiunile din arhitectură trebuie să acceseze doar resursele mașinii virtuale curente Pentru majoritatea echipelor, această cerință este implementată în mod elementar De exemplu, instrucțiunile aritmetice ar trebui să funcționeze numai pe un fișier de registru, care poate fi virtualizat prin copierea registrelor mașinii virtuale în fișierul de registru al procesorului pe un comutator de context Virtualizarea instrucțiunilor de memorie (de exemplu, instrucțiuni de încărcare și stocare) este mai complicată, deoarece aceste instrucțiuni ar trebui să acceseze numai celulele de memorie fizică alocate mamei virtuale curente De obicei, un procesor care acceptă virtualizarea hardware trebuie să ofere un mecanism suplimentar de mapare a paginilor care leagă paginile de memorie fizică ale mașinii virtuale la paginile de memorie fizică ale computerului În cele din urmă, comenzile I/O (inclusiv I/O mapate în memorie) nu ar trebui să funcționeze direct pe dispozitivele I/O fizice, deoarece politica de virtualizare dictează adesea accesul la dispozitivele I/O Controlul I/O cu granulație fină este implementat de obicei prin întreruperi ale hypervisorului de fiecare dată când mașina virtuală încearcă să acceseze un dispozitiv I/O Acest lucru permite hypervisorului să implementeze politica de acces la resurse I/O pe care o consideră potrivită De obicei, un set de dispozitive I/O este acceptat, iar sistemele de operare care rulează în mașini virtuale (sisteme de operare invitate) folosesc numai aceste dispozitive acceptate Virtualizarea hardware în COG i Virtualizarea hardware în Coga i este susținută de extensiile de mașină virtuală VMX (Virtual Machine eXtcnsions) - un set de extensii de comandă, memorie și întrerupere care asigură controlul eficient al mașinilor virtuale În VMX, virtualizarea memoriei este implementată de sistemul EPT (Extended Page Table), care poate fi utilizat în virtualizarea hardware EPT traduce adresele paginilor fizice ale mașinii virtuale în adrese fizice ale computerului folosind o structură suplimentară de tabel stratificat, al cărei conținut este parcurs pe rata TLB a unei mașini virtuale Tabelul este întreținut de hypervisor, care poate organiza orice schemă dorită pentru partajarea memoriei fizice Virtualizarea operațiunilor I/O (atât comenzile, cât și I/O mapate în memorie) este implementată pe baza suportului extins de întrerupere definit în VMCS (Virtual-Machine Control Structure) Întreruperea hypervisorului este declanșată de fiecare dată când mașina virtuală accesează un dispozitiv I/O Când se primește o întrerupere, hypervisorul implementează operația I/O în software conform regulilor necesare pentru partajarea dispozitivelor I/O între mașinile virtuale Comenzi I/O virtuale După cum știți deja, seturile de instrucțiuni la nivel de arhitectură de instrucțiuni și la nivel de microarhitectură sunt complet diferite Nu numai comenzile în sine diferă, ci și formatele lor, iar unele coincidențe sunt complet aleatorii Setul de instrucțiuni la nivel de sistem de operare conține majoritatea instrucțiunilor la nivel de arhitectură de instrucțiuni, precum și câteva comenzi noi foarte importante În același timp, unele comenzi noi, dar importante la nivel de sistem de operare nu sunt acceptate I/O este o zonă în care cele două niveluri diferă foarte semnificativ Motivul acestor diferențe este simplu În primul rând, un utilizator capabil să execute instrucțiuni I/O la nivelul arhitecturii instrucțiunilor poate citi informații sensibile stocate undeva în „sălbăticia” sistemului de operare, ceea ce reprezintă potențial o amenințare pentru sistem În al doilea rând, un programator normal este complet reticent să implementeze I/O la nivelul arhitecturii de instrucțiuni, deoarece este prea complicat și plictisitor În schimb, pentru I/O, puteți pur și simplu să setați anumite câmpuri și biți într-un număr de registre de dispozitiv, apoi așteptați finalizarea operației și verificați ce s-a întâmplat De obicei, biții de înregistrare a dispozitivului de disc vă permit să detectați următoarele erori: + hardware-ul discului nu s-a poziționat; + element de memorie inexistent definit ca un buffer; + Procesul I/O de pe disc (pe disc) a început înainte ca cel precedent să se încheie; + eroare de sincronizare la citire; + acces la un disc inexistent; + acces la un cilindru inexistent; + apel la un sector inexistent; + Nepotrivirea sumelor de control în timpul citirii; + eroare de verificare a scrierii Dacă una dintre aceste erori este prezentă, marele corespunzător este setat în registrul dispozitivului Puțini utilizatori doresc să țină evidența tuturor acestor erori împreună cu o mulțime de informații despre stare Fișiere O modalitate de a face I/O virtuală este să utilizați o abstractizare numită fișier Un fișier constă dintr-o secvență de octeți scrisi pe un dispozitiv I/O Dacă dispozitivul de intrare/ieșire este un dispozitiv de stocare (de exemplu, un disc), atunci fișierul poate fi citit înapoi Dacă dispozitivul nu este un dispozitiv de stocare a informațiilor (de exemplu, este o imprimantă), atunci fișierul nu poate fi citit de acolo Un disc poate stoca multe fișiere, fiecare conținând un anumit tip de date, cum ar fi o imagine, o foaie de calcul sau un text Fișierele au lungimi diferite și au proprietăți diferite Această abstractizare facilitează organizarea I/O virtuală Pentru sistemul de operare, un fișier este pur și simplu o secvență de octeți Toată structurarea este determinată exclusiv la nivelul programelor de aplicație I/O este efectuată prin apeluri de sistem pentru a deschide, citi, scrie și închide fișiere Înainte ca un fișier să poată fi citit, acesta trebuie deschis Procesul de deschidere a unui fișier permite sistemului de operare să localizeze fișierul pe disc și să transfere în memorie informațiile de care are nevoie pentru a accesa fișierul După deschiderea fișierului, puteți citi datele din acesta Apelul de sistem citit trebuie să aibă cel puțin următorii parametri: + informații despre ce fișier deschis să citiți; + pointer către buffer-ul din memorie unde ar trebui să fie plasate datele; este numărul de octeți care trebuie citiți Acest apel de sistem pune datele necesare într-un buffer De obicei returnează numărul de octeți citiți Acest număr poate fi mai mic decât numărul solicitat (de exemplu, nu puteți citi de octeți dintr-un fișier de de octeți) Fiecare fișier deschis are asociat un pointer care spune ce octet trebuie citit în continuare După comanda de citire, indicatorul este umplut cu numărul de octeți citiți, așa că citesc comenzile de citire succesive! blocuri consecutive de date dintr-un fișier De obicei, acest indicator poate fi setat la o valoare specială, astfel încât programele să poată accesa orice parte a fișierului Când un program termină de citit un fișier, îl poate închide și poate spune sistemului de operare că nu va mai folosi fișierul Apoi sistemul de operare va putea elibera spațiu în structura în care au fost stocate informații despre acest fișier Mainframe-urile sunt încă în uz (în special pentru a servi site-uri de comerț electronic foarte mari) și multe dintre ele rulează sisteme de operare tradiționale (deși mulți rulează Linux) Sistemele de operare mainframe tradiționale utilizează un model de fișier ușor diferit Aici fișierul poate fi o secvență de înregistrări logice, fiecare dintre ele având o structură bine definită De exemplu, o înregistrare logică ar putea fi o structură de date formată din cinci câmpuri: două șiruri de caractere, „Nume” și „Cap”, două numere întregi, „Departament” și „Cameră” și o valoare booleană „Gender Femei” Unele sisteme de operare fac distincție între fișierele în care toate elementele au aceeași structură și fișierele care conțin diferite tipuri de date Comanda principală de intrare virtuală citește următoarea intrare din fișierul dorit și o plasează în memoria principală, începând de la o anumită adresă, așa cum se arată în Fig Pentru a efectua această operație, instrucțiunea virtuală trebuie să știe ce fișier să citească și unde în memorie să plaseze scrierea Adesea există opțiuni pentru citirea unei anumite înregistrări, care sunt determinate fie de locația sa în fișier, fie de cheia acesteia Numărul de înregistrare logic Tampon O singură intrare logică douăzeci memoria principala Intrare logică b Orez Citirea unui fișier format din înregistrări logice: înainte de citirea înregistrării (a); după citirea punctului (b) Comanda principală de ieșire virtuală scrie o înregistrare logică din memorie într-un fișier Comenzile de unire secvențială efectuează scrieri logice secvențiale într-un fișier Implementarea comenzilor I/O virtuale Pentru a înțelege cum sunt implementate comenzile I/O virtuale, trebuie să înțelegeți bine cum sunt structurate și stocate fișierele Principala problemă care trebuie rezolvată pentru toate sistemele de fișiere este alocarea spațiului O unitate de alocare (numită și „bloc”) poate fi un singur sector pe un disc, dar mai des un bloc este format din mai multe sectoare consecutive comenzi virtuale I/O dud O altă proprietate fundamentală a implementării unui sistem de fișiere este modul în care blocurile de alocare sunt așezate (secvențial sau non-secvențial) Pe fig Figura prezintă un disc simplu cu o suprafață, constând din cinci piste, dar câte sectoare fiecare Pe fig , iar dosarul este format din sectoare consecutive Aranjamentul secvenţial al blocurilor este tipic pentru CD-uri Pe fig , b dosarul ocupă sectoare neconsecutive Această schemă este tradițională pentru hard disk-uri (și bineînțeles, pentru hard disk-uri) Sector Sector Direcția de rotație a discului Sector Sector Direcția de rotație a discului a b Orez Opțiuni pentru locația fișierului pe disc: fișierul ocupă sectoare consecutive (a); dosarul ocupă sectoare neconsecutive (b) Percepția unui fișier de către un programator de aplicații este foarte diferită de percepția unui fișier de către un sistem de operare Programatorul consideră un fișier ca o secvență liniară de octeți sau înregistrări logice Sistemul de operare tratează un fișier ca pe un set ordonat, deși nu neapărat secvenţial, de blocuri alocabile pe disc Pentru ca un sistem de operare să furnizeze un octet sau o înregistrare logică dintr-un fișier la cerere, trebuie să folosească o metodă pentru a localiza datele Dacă fișierul este contiguu, sistemul de operare trebuie să știe doar de unde începe fișierul pentru a calcula poziția octetului sau a înregistrării logice dorite Dacă fișierul nu este localizat secvențial pe disc, atunci numai din poziția inițială a fișierului este imposibil să se calculeze poziția unui octet arbitrar sau a unei înregistrări logice în acest fișier Pentru a găsi un octet arbitrar sau o intrare logică, aveți nevoie de un tabel numit index de fișier care vă permite să obțineți blocurile stocate pe disc și adresele lor fizice Un index poate fi organizat fie ca o listă de adrese de bloc (așa cum este folosită în UNIX), fie ca o listă de intrări logice, fiecare având o adresă de disc și un offset Uneori, fiecare intrare logică are o cheie, iar programele pot accesa intrarea prin acea cheie, mai degrabă decât prin numărul intrării logice În acest din urmă caz, fiecare element al tabelului trebuie să conțină ns ilaoa i conduce doar informații despre locația înregistrării pe disc, dar și cheia acesteia Această structură este folosită în mod obișnuit în sistemele principale O metodă alternativă pentru găsirea blocurilor alocabile într-un fișier este organizarea fișierului ca o listă legată În acest caz, fiecare bloc de alocare conține adresa următorului bloc Pentru a implementa eficient această schemă, în memoria principală este stocat un tabel cu toate adresele ulterioare De exemplu, pentru un disc cu blocuri de KB, sistemul de operare poate avea în memorie un tabel cu intrări de KB, fiecare conţinând indexul următorului bloc de alocare Deci, dacă fișierul ocupă blocurile , și , atunci elementul din tabel va conține numărul , elementul - numărul și elementul - un cod special care indică sfârșitul fișierului (de exemplu, sau - ) Așa funcționau sistemele de fișiere în MS-DOS, Windows și Windows Versiuni mai noi de Windows ( , XP, Vista și ) suportă acest sistem de fișiere, dar are și propriul său sistem de fișiere, care seamănă mai mult cu sistemul de fișiere UNIX Până acum, am spus că fișierele de pe un disc pot fi localizate atât secvențial, cât și inconsecvent, dar nu am explicat încă de ce sunt necesare aceste două aranjamente Fișierele secvențiale sunt ușor de gestionat, dar dacă dimensiunea maximă a fișierului nu este cunoscută dinainte, această tehnologie nu poate fi utilizată Dacă un fișier începe de la sectorul j și continuă spre sectoarele învecinate, s-ar putea întâlni cu un alt fișier din sectorul k, atunci nu va avea suficient spațiu pentru a se extinde Dacă fișierul este inconsecvent, atunci nu există astfel de probleme, deoarece următoarele blocuri pot fi plasate într-un loc diferit de pe disc Dacă discul conține un număr de fișiere „de lucru”, ale căror dimensiuni finale pot varia, este aproape imposibil să le scrieți pe disc în blocuri de alocare consecutive Uneori este posibil să mutați un fișier existent, dar acest lucru este întotdeauna asociat cu un cost semnificativ de timp și resurse de sistem În același timp, dacă dimensiunea maximă a tuturor fișierelor este cunoscută dinainte (de exemplu, așa cum se întâmplă la inscripționarea unui CD), programul poate aloca în avans secvențe de sectoare care sunt exact egale ca lungime fiecărui fișier Dacă fișierele de sector , , și vor fi plasate pe un CD, ele pot începe pur și simplu de la sectoarele , , și, respectiv, (cuprinsul nu este luat în considerare aici) Găsirea oricărei părți a oricărui fișier este ușor, deoarece primul sector al fișierului este cunoscut Pentru a aloca spațiu pe disc pentru un fișier, sistemul de operare trebuie să țină evidența blocurilor disponibile și care sunt deja ocupate de alte fișiere Când scrieți pe un CD, calculul se face o dată pentru totdeauna, în timp ce pe hard disk, fișierele sunt scrise și șterse constant O modalitate de a ține evidența stării de sănătate a discului este să păstrați o listă cu toate golurile (fragmentele neutilizate), unde un fragment gol poate fi la fel de mare ca orice număr de blocuri de alocare consecutive Această listă se numește lista gratuită Pe fig , a arată lista de memorie liberă pentru disc din Figura , O soluție alternativă este stocarea unui bitmap de disc (un bit per bloc de alocare), așa cum se arată în Figura , Un bit indică faptul că blocul este deja ocupat, iar un zero indică că este liber Comenzi I/O virtuale U joint venture Ha Ha cinci Pista O unu Sector b £ f o F F £ f F Oh, oh despre despre O Orez Două abordări pentru urmărirea sectoarelor libere: lista de memorie liberă (a); bitmap (b) Prima abordare facilitează găsirea unui fragment neutilizat de o anumită lungime Cu toate acestea, această metodă are un dezavantaj: pe măsură ce fișierele sunt create și distruse, dimensiunea listei se va schimba, iar acest lucru nu este de dorit Avantajul unui bitmap este că dimensiunea sa este constantă În plus, pentru a schimba starea unui bloc de alocare (de la liber la ocupat sau invers), este suficient să modificați valoarea unui singur bit Cu toate acestea, cu această abordare, este dificil să găsiți un bloc de o dimensiune dată Ambele metode necesită ca atunci când un fișier este scris pe disc sau un fișier este șters de pe disc, lista de locații sau harta să fie actualizată Înainte de a părăsi discuția despre implementarea sistemului de fișiere, trebuie spus câteva cuvinte despre dimensiunea blocului de alocare Aici intervin mai mulți factori În primul rând, accesul la disc încetinește timpul de căutare și timpul petrecut cu rotația discului Dacă este nevoie de milisecunde pentru a găsi începutul unui bloc, atunci este mult mai profitabil să citiți KB (care va dura aproximativ o milisecundă) decât KB (care va dura aproximativ , milisecunde), deoarece dacă citiți KB ca blocuri de KB, va trebui să efectuați o căutare de ori Sunt necesare blocuri mari de alocare pentru a îmbunătăți performanța Desigur, pe măsură ce prețul scade și popularitatea SSD-urilor crește, acest argument își pierde treptat din importanță, deoarece aceste dispozitive au timp de poziție zero Există și un alt argument în favoarea blocurilor mari: cu cât dimensiunea blocului este mai mică, cu atât ar trebui să existe mai multe Un număr mare de blocuri alocate implică, la rândul său, indecși mari de fișiere și structuri mari de liste legate în memorie De exemplu, în sistemul MS-DOS, dimensiunea blocului era inițial de un sector ( octeți), iar sectoarele erau identificate prin numere de biți Când dimensiunea discurilor a început să depășească sectoarele de KB, a existat o singură modalitate de a utiliza tot spațiul pe disc cu identificarea blocului de biți: creșterea dimensiunii blocului Prima versiune a Windows a avut aceeași problemă, dar o versiune ulterioară* a folosit deja numere pe de biți Windows a acceptat ambele opțiuni eu lava i nivelul sistemului de operare Cu toate acestea, blocurile mici au și avantajele lor Faptul este că fișierele ocupă foarte rar exact un număr întreg de blocuri de alocare În consecință, aproape fiecare fișier va avea spațiu neutilizat în ultimul bloc de alocare Dacă dimensiunea fișierului este mult mai mare decât dimensiunea blocului de alocare, atunci spațiul mediu neutilizat va fi jumătate din bloc Cu cât blocul este mai mare, cu atât mai mult spațiu liber rămâne Dacă dimensiunea medie a fișierului este mult mai mică decât dimensiunea blocului de alocare, cea mai mare parte a spațiului pe disc va fi nefolosit De exemplu, în MS-DOS sau prima versiune de Windows cu o partiție de disc de GB, dimensiunea blocului de alocare este de KB, așa că atunci când un fișier de de caractere este scris pe disc, se irosesc de octeți de spațiu pe disc În ceea ce privește alocarea spațiului pe disc, blocurile de alocare mici au prioritate față de cele mari În prezent, cel mai important factor este rata de transfer de date, astfel încât dimensiunea blocurilor este în continuă creștere Comenzi de gestionare a directorului Cu mulți ani în urmă, programele și datele erau stocate pe carduri perforate Pe măsură ce programele au crescut în dimensiune și datele au devenit din ce în ce mai multe, această formă de stocare a devenit incomodă Atunci a apărut ideea de a folosi memoria auxiliară (de exemplu, un disc) pentru a stoca programe și date în loc de carduri perforate Informațiile care sunt disponibile unui computer fără intervenție umană se numesc operaționale (on-line) În schimb, informațiile off-line necesită intervenție umană (de exemplu, pentru a introduce un CD, un stick USB sau un card SD) Informațiile operaționale sunt stocate în fișiere Programele îl pot accesa prin intermediul programelor I/O Sunt necesare comenzi suplimentare pentru a ține evidența informațiilor operaționale, a le grupa în blocuri convenabile și a le proteja de utilizarea ilegală De obicei, sistemul de operare grupează fișierele de informații operaționale în directoare Pe fig ilustrează un exemplu de astfel de organizație În acest caz, apelurile de sistem sunt acceptate pentru cel puțin următoarele funcții: + crearea unui fișier și includerea acestuia în director; + ștergerea unui fișier dintr-un director; + redenumirea fișierelor; + modificați starea protecției fișierelor Toate sistemele de operare moderne vă permit să stocați mai mult de un director Fiecare director este de obicei un fișier în sine și, ca atare, poate fi inclus într-un alt director, rezultând o structură arborescentă ierarhică a directoarelor Un număr mare de directoare este deosebit de convenabil pentru programatorii care lucrează la mai multe proiecte Ei pot grupa toate fișierele asociate unui proiect într-un singur director Directoarele sunt, de asemenea, bune pentru partajarea fișierelor în grupuri de lucru Fișier Nume fișier: Rubber-ducky Dimensiunea fișierului : Fișierul Tip: Anatidae dataram Dosarul Data creării: martie Fișierul Ultima accesare: septembrie Dosarul ex Semafor = semafor + (dacă un alt proces încearcă acum să efectueze o operație de jos pe acest semafor, poate face acest lucru și își poate continua munca) Semafor = semafor + jos Procesul este suspendat până când un alt proces efectuează o operație ip pe acest semafor Semafor = semafor - După cum sa menționat deja, problema rasei poate fi rezolvată prin intermediul limbajului Java, dar acum discutăm despre sisteme de operare, prin urmare, trebuie să implementăm cumva mecanismul semaforului în Java, deoarece nu există o clasă standard pentru ele Totuși, putem face acest lucru presupunând că cele două metode, sus și jos, care fac respectiv apelurile de sistem sus și jos, au fost deja scrise și folosesc numere întregi obișnuite ca parametri Lista arată cum puteți rezolva condițiile de cursă folosind semafoare La clasa m se adaugă două semafore: un semafor disponibil, inițial egal cu (aceasta este dimensiunea tamponului) și un semafor umplut, inițial egal cu Producătorul începe cu declarația P , iar consumatorul începe cu declarația C Apelarea la semaforul umplut suspendă imediat consumatorul Când producătorul găsește primul număr, apelează metoda down cu variabila disponibilă ca parametru, setând-o la În instrucțiunea P , producătorul apelează metoda up cu parametrul completat, setând variabila completată la Aceasta acțiunea eliberează consumatorul, care poate finaliza acum apelul la metodă După aceea, umplut devine și ambele procese continuă Lista - - Operare paralelă folosind semafore public class m { final public static int BUF SIZE = ; // tampon de la la final public static long MAX PRIME= L; // opriți aici public static int in = , out = ; // indicii către date public static long buffer[ ] = nou lung[BUF SIZE]; // numerele sunt stocate aici producator public static p; // numele fabricantului consumator public static c; // numele consumatorului public static int complet = , disponibil = ; // semafoare public static void main(String args[ ]) { // clasa principală p = nou producator(); // creează un producător c = consumator nou(); // creează consumator R start(); // începe producătorul cu start(); // porniți consumatorul comenzi virtuale pentru vărsături paralele // Aceasta este o funcție de aplicație pentru public static int next(int k) else return(O);} creștere ciclică ip și afară {dacă (k modul Orez Structura unui sistem UNIX tipic Deasupra driverelor de dispozitiv este sistemul de fișiere Opa gestionează fișierele, directoarele, alocarea blocurilor de disc, securitatea și multe alte funcții Sistemul de fișiere are așa-numitul block cache (Locc cache), conceput pentru a stoca blocurile citite recent de pe disc în cazul în care sunt necesare din nou Sunt utilizate unele sisteme de fișiere a căzut de mulți ani Printre acestea se numără sistemul rapid de fișiere Berkeley [McKusick și colab , ] și sistemul de fișiere jurnal | Rosenbluin și Ousterhout, ; Seltzer şi colab , ] O altă parte a nucleului UNIX este mecanismul de gestionare a proceselor Îndeplinește diverse funcții, inclusiv suport pentru interacțiunea dintre procese (InterProcess Communication, IPC) și sincronizarea acestora, ceea ce evită condițiile de cursă Codul de management al proceselor este, de asemenea, responsabil pentru planificarea proceselor pe baza priorităților acestora De asemenea, gestionează semnalele, care sunt o formă specială (asincronă) de întreruperi software În cele din urmă, gestionează și memoria Majoritatea sistemelor UNIX acceptă memoria virtuală de paginare la cerere, uneori cu unele caracteristici suplimentare (de exemplu, mai multe procese pot împărtăși zone comune ale spațiului de adrese) UNIX a fost conceput inițial ca un sistem foarte compact; compactitatea a fost menită să ofere fiabilitate și performanță sporite Primele versiuni ale UNIX erau toate bazate pe text și concentrate pe terminale care puteau afișa sau de linii de de caractere ASCII Interfața cu utilizatorul a fost controlată de un program numit shell care a furnizat o interfață de linie de comandă Deoarece shell-ul nu face parte din kernel, este ușor să adăugați noi shell-uri la UNIX și au fost dezvoltate de-a lungul timpului mai multe shell-uri extrem de complexe Mai târziu, odată cu introducerea terminalelor grafice, MIT a dezvoltat un sistem de ferestre pentru UNIX numit X Windows Mai recent, pe X Windows a fost instalată o interfață grafică de utilizator (GUI) cu funcții complete numită Motif Deoarece nucleul trebuia să rămână compact, aproape tot codul pentru X Windows și Motif rulează în afara nucleului în modul utilizator Windows Primul PC IBM, lansat în , era echipat cu un sistem de operare pe biți, în mod real, orientat spre utilizator, cu o interfață de linie de comandă Se numea MS-DOS Acest sistem de operare era un cod de kiloocteți care se afla în memorie Doi ani mai târziu, a apărut un sistem MS-DOS mai puternic de de kiloocteți Conținea un procesor de linie de comandă (shell) și multe dintre caracteristicile sale au fost împrumutate din sistemul UNIX În , IBM a lansat o mașină PC/AT cu sistemul de operare MS DOS- , care la acel moment avea deja o dimensiune de Kbytes De-a lungul anilor, MS-DOS a adăugat din ce în ce mai multe funcții, dar a rămas un sistem de linie de comandă Inspirat de succesul Apple Macintosh, Microsoft a decis să creeze o interfață grafică de utilizator pe care a numit-o Windows Primele trei versiuni de Windows, inclusiv Windows x, nu erau sisteme de operare „reale”, ci interfețe grafice de utilizator bazate pe MS-DOS Toate programele rulau în același spațiu de adrese, iar o greșeală în oricare dintre ele ar putea duce la „înghețarea” întregului sistem În , a apărut sistemul Windows , dar nu a marcat abandonarea MS-DOS, dar noul MS-DOS a înlocuit versiunea anterioară de MS-DOS Windows și MS-DOS combinate aveau caracteristicile importante* ale unui sistem de operare avansat, inclusiv suport pentru memorie virtuală, managementul proceselor și multiprogramare Cu toate acestea, sistemul de operare Windows nu era un program complet pe de biți Opa conținea bucăți mari din vechiul cod de biți (cu puțin cod de de biți) și încă folosea sistemul de fișiere MS-DOS, cu toate deficiențele sale Singurele modificări semnificative ale sistemului de fișiere au fost o creștere a lungimii numelor de fișiere (anterior în MS-DOS, numele fișierelor erau limitate la + caractere) și eliminarea limitei anterioare (egale cu ) privind numărul de blocuri de disc Chiar și în Windows , lansat în , codul MS-DOS pe biți (de data aceasta versiunea ) era încă prezent Windows nu diferă prea mult de Windows , deși unele caracteristici au fost transferate de la MS-DOS în Windows, iar un format de disc potrivit pentru discuri mai mari a devenit standard Principala diferență a fost interfața cu utilizatorul, care combina desktop-ul, internetul și chiar, într-o oarecare măsură, televiziunea, făcând sistemul mai autonom Acesta este ceea ce a atras atenția Departamentului de Justiție al SUA, care a acuzat Microsoft de încălcarea legilor antitrust După ceva timp, o ediție ușor îmbunătățită a Windows a fost lansată sub numele Windows Millennium Edition (ME), dar nu a durat mult În timpul tuturor acestor evenimente, Microsoft dezvolta un nou sistem de operare perfect pe de biți Acest nou sistem a fost numit Windows New Technology (noua tehnologie Windows), sau pe scurt Windows NT Inițial trebuia să înlocuiască toate sistemele de operare concepute pentru calculatoare bazate pe procesoare Intel (precum și pe cele bazate pe PowerPC), dar distribuția sa a fost foarte lentă și ulterior a fost reorientată către computere mai puternice În acest segment, Windows N și-a găsit drum în serverele mari A doua versiune de Windows NT, numită Windows , a avut mult mai mult succes, inclusiv în segmentul computerelor de acasă Windows XP a devenit un adept al Windows , dar diferențele nu sunt atât de semnificative (în mare parte compatibilitate cu versiunea precedentă îmbunătățită și o serie de caracteristici suplimentare) În , a fost lansat următorul sistem din familia Windows, Windows Vista Au fost implementate numeroase îmbunătățiri grafice, precum și adăugate aplicații noi (de exemplu, Media Center) Utilizatorii nu s-au grăbit să migreze la Vista din cauza performanței scăzute și a cerințelor ridicate Lucrările la sistemul de operare, care mai târziu a fost numit Windows NT, a început după o serie de eșecuri cu versiunea pe biți a OS/ , ca parte a unui proiect comun între IBM și Microsoft pentru a crea un nou OS/ pe de biți sistem de operare Acest proiect, axat pe microprocesorul I , a început în , dar în anul următor cele două companii s-au despărțit, iar Microsoft a continuat să lucreze la OS/ v i-a dat numele Windows NT, dorind astfel, în primul rând, să se distanțeze de IBM și, în al doilea rând, să sublinieze faptul că folosește o singură interfață grafică cu toate shell-urile sale populare cu același nume - Notă științific ed DM ilava despre nivelul sistemului de operare la resurse Doar doi ani mai târziu, a fost lansat Windows , care este din toate punctele de vedere o versiune optimizată a Windows Vista Windows rulează mult mai bine pe hardware mai vechi și necesită mult mai puține resurse hardware Windows este vândut în șase ediții diferite Trei versiuni sunt pentru utilizatorii casnici din diferite țări, două sunt pentru utilizatorii de afaceri și una combină caracteristicile tuturor versiunilor Versiunile sunt aproape identice; diferă doar prin focalizare, funcții avansate și optimizări Ne vom limita la trecerea în revistă a funcțiilor principale, fără a ne abate la o discuție asupra diferențelor dintre versiuni Înainte de a trece la interfața pe care Windows o oferă programatorului, să aruncăm o privire foarte scurtă asupra structurii interne a sistemului, prezentată în Figura Constă dintr-un număr de module distribuite pe niveluri și care implementează în comun sistemul de operare Fiecare modul îndeplinește o funcție specifică și are o interfață specifică cu alte module Aproape toate modulele sunt scrise în C, deși o parte din interfața grafică este scrisă în C++, iar unele dintre cele mai joase niveluri sunt în asamblator Modul utilizator Biblioteca de sistem - Funcții de expediere în modul utilizator Mod privilegiat Stratul de nucleu NTOS Expediere excepție/întrerupere Programarea și sincronizarea CPU, firele de execuție Drivere Sisteme de fișiere, manager de volum, stivă TCP/IP, interfețe de rețea, dispozitive grafice, toate celelalte dispozitive Proceduri și fire de execuție Memoria virtuală Gestionarea obiectelor Gestionarea configurației Apeluri de procedură locală Management cache Management I/O Management Security Monitor Bibliotecă executabilă de execuție NTOS la nivel executiv Stratul de abstractizare hardware Procesor, manager de memorie, controlere de întrerupere, memorie, dispozitive fizice, BIOS Orez Structura Windows Hardware În partea de jos se află stratul de abstractizare hardware Ar trebui să ofere sistemului de operare niște dispozitive abstracte, lipsite de toate defectele și ciudateniile în care dispozitivele reale sunt atât de bogate Dispozitivele simulate includ memorie cache off-chip, generatoare de ceas, magistrale I/O, controlere de întrerupere, controlere de acces direct la memorie Dacă aceste dispozitive sunt furnizate sistemului de operare într-o formă idealizată, va facilita portarea Windows pe alte platforme hardware, deoarece majoritatea modificărilor vor trebui făcute într-un singur loc Peste nivelul abstracțiilor hardware, codul este împărțit în două subsisteme majore: stratul executiv NTOS și driverele Windows, care includ codul sistemului de fișiere exemple de săli de operație Cum sisteme, suport de rețea și grafică Deasupra lor este nivelul nucleului Tot codul ;and'from este executat într-un mod privilegiat protejat Stratul executiv gestionează cele mai importante abstracții din Windows : fire de execuție, procese, memorie virtuală, obiecte kernel și configurație De asemenea, găzduiește subsisteme pentru gestionarea apelurilor de procedură locală, stocarea în cache a fișierelor, I/O și securitate În afara nucleului sunt programe de utilizator și o bibliotecă de sistem folosită pentru a interacționa cu sistemul de operare Spre deosebire de* UNIX, Microsoft nu încurajează programele utilizatorului să utilizeze direct apelurile de sistem Pentru a asigura standardizarea între diferite versiuni de Windows (de exemplu, XP, Vista și Windows ), a fost definit un set de funcții cunoscut sub numele de Win API (Application Programming Interface) Acestea sunt funcții de bibliotecă care* efectuează anumite acțiuni fie în sistem prin apeluri de sistem, fie, în unele cazuri, direct într-o procedură de bibliotecă în spațiul utilizatorului În timp ce multe funcții noi de bibliotecă au fost adăugate la Windows de la definirea Win , funcțiile de bază au rămas neschimbate; asupra lor ne vom concentra Windows a fost ulterior portat pe mașini pe de biți, iar Microsoft a schimbat numele suitei din Win în Win , dar pentru scopurile noastre, versiunea pe de biți este suficientă Filosofia Win API este complet diferită de filozofia UNIX În UNIX, toate apelurile de sistem sunt binecunoscute și formează o interfață minimă: eliminarea chiar și a unuia dintre ele va schimba modul în care funcționează sistemul de operare Subsistemul Win oferă o interfață redundantă în care aceeași acțiune poate fi adesea efectuată în trei sau patru moduri diferite În plus, Win include multe funcții care nu sunt apeluri de sistem (cum ar fi copierea unui întreg fișier) Multe apeluri API Win creează obiecte kernel de un fel sau altul (fișiere, procese, fire de execuție, conducte etc ) Fiecare apel care duce la crearea unui obiect kernel returnează un rezultat programului apelant, care se numește identificator (descriptor) (mâner) Acest mâner poate fi folosit ulterior pentru a efectua operații asupra obiectului Fiecare proces are propriul său mâner Nu poate fi transmis direct unui alt proces și utilizat de acel proces (descriptorii de fișiere din UNIX nu pot fi, de asemenea, transferați altor procese) Cu toate acestea, în anumite circumstanțe, puteți duplica mânerul, îl puteți transmite altor procese și le puteți permite accesul la obiecte care aparțin altor procese Fiecare obiect are asociat un descriptor de securitate care determină cine este permis și cine nu are voie să efectueze anumite operațiuni asupra obiectului Sistemul de operare Windows este uneori numit orientat pe obiecte, deoarece este posibil să se opereze pe obiecte kernel numai prin descriptorii lor prin apelarea metodelor (funcții API) Pe de altă parte, nu acceptă astfel de caracteristici de bază ale unui sistem orientat pe obiecte precum moștenirea și polimorfismul I IQBCI V /rivopv sistem de irigare Exemple de memorie virtuală În această subsecțiune, vom vorbi despre memoria virtuală în UNIX și Windows Din punctul de vedere al unui programator, acestea sunt foarte asemănătoare în multe privințe memorie virtuală UNIX Modelul de memorie UNIX este destul de simplu Fiecare proces are trei segmente: cod, date și stivă, așa cum se arată în Fig Într-o mașină cu un spațiu de adrese liniar, codul este de obicei situat în partea de jos a memoriei, urmat de date Stiva este plasată în partea de sus a memoriei Dimensiunea codului este fixă, iar datele și stiva pot crește sau micșora (în direcții diferite) Acest model este ușor de implementat pe aproape orice mașină În special, este folosit de variantele Linux care rulează pe procesoare TMAP Adresa Stiva xFFFFFFFF Date Cod O - Orez Spațiu de adresă pentru un singur proces în UNIX Mai mult, dacă aparatul acceptă memorie paginată, atunci întregul spațiu de adrese poate fi paginat complet transparent pentru programele utilizatorului Ei vor ști doar că dimensiunea programului poate depăși dimensiunea memoriei fizice a mașinii Acele sisteme UNIX care nu acceptă paginarea schimbă de obicei procese întregi între memorie și disc, astfel încât un număr arbitrar de procese să poată rula în paralel Descrierea anterioară a sistemului UNIX (paging memorie virtuală la cerere) este în general în concordanță cu versiunea Berkeley a UNIX, dar versiunile System V (și Linux) au câteva trăsături care permit utilizatorilor să gestioneze memoria virtuală Cel mai important este capacitatea unui proces de a mapa un fișier, sau o parte a unui fișier, la o porțiune din spațiul de adrese al procesului De exemplu, dacă un fișier de KB este mapat la adresa virtuală K, atunci celula de la adresa K va conține primul cuvânt al acelui fișier Astfel, este posibil să efectuați I/O fișier fără apeluri de sistem Deoarece unele fișiere sunt mai mari decât spațiul de adrese virtuale, este posibil să se afișeze nu întregul fișier, ci doar o parte a acestuia Pentru a afișa, mai întâi trebuie să deschideți fișierul și să obțineți descriptorul de fișier fd (descriptor de fișier) Mânerul este folosit pentru a identifica fișierul afișat Procesul efectuează apoi un apel paddr = mmap(adresă virtuală, lungime, protecție, steaguri, fd, offset fișier) Acest apel mapează octeții de lungime, începând de la offset-ul file offset din fișier, la spațiul de adrese virtuale, începând de la adresa virtuale exemple de sisteme de operare sau*r Parametrul flags necesită ca sistemul să selecteze adresa virtuală pe care Vatem o returnează în parametrul paddr Zona de afișare trebuie să fie aliniată la pagină și să conțină un număr întreg de pagini Parametrul de protecție specifică nivelul de protecție, inclusiv capacitatea de a citi, scrie și executa (orice combinație) Maparea poate fi eliminată ulterior folosind comanda unmap Mai multe procese pot afișa același fișier în același timp Există două opțiuni de împărțire În prima variantă, toate paginile sunt partajate, astfel încât intrările făcute de un proces sunt disponibile pentru Toate celelalte procese Această capacitate oferă o comunicare de mare viteză între procese În a doua variantă, paginile rămân comune tuturor proceselor atâta timp cât niciunul dintre procese nu le modifică De îndată ce un proces încearcă să scrie pe o pagină, va primi o eroare de securitate, determinând sistemul de operare să îi furnizeze propria copie a paginii pentru scriere Această schemă, numită copy on write (copy on write), este utilizată atunci când fiecare dintre mai multe procese trebuie să creeze iluzia că este singurul care realizează maparea fișierului În acest model, partajarea este o optimizare, nu o parte a semanticii Memorie virtuală Windows În Windows , fiecare proces de utilizator are propriul său spațiu virtual Pe Windows pe de biți, spațiul virtual hell are de biți, astfel încât fiecare proces are GB de spațiu virtual hell Cei GB de jos sunt pentru codul de proces și date; primii GB oferă acces la memoria nucleului (limitată) Excepție fac versiunile de server ale Windows , unde partajarea memoriei poate fi diferită ( GB pentru utilizator și GB pentru kernel) Spațiul de adrese virtuale cu pagini de paginare la cerere conține pagini de dimensiune fixă” ( KB pentru Cope I ) Spațiul de adresă al versiunii pe de biți a Windows are o structură similară, dar spațiul de cod și date din acesta se află în cei teraocteți inferiori ai spațiului de adrese virtuale Fiecare pagină virtuală poate fi în una dintre cele trei stări: gratuită, rezervată sau angajată Pagina gratuită nu este utilizată în prezent, iar accesarea ei provoacă o eroare de ieşire a paginii Când începe un proces, toate paginile sale sunt într-o stare liberă până când programul și datele inițiale sunt mapate în spațiul lor de adrese Dacă codul sau datele sunt mapate la o pagină, atunci pagina respectivă este selectată Un acces la o pagină alocată va avea succes dacă pagina se află în memoria principală Dacă pagina nu se află în memoria principală, va apărea o eroare și sistemul de operare va trebui să preia pagina corectă de pe disc O pagină virtuală poate fi, de asemenea, într-o stare rezervată Aceasta înseamnă că pagina rămâne indisponibilă pentru afișare până când rezervarea este anulată În plus față de atributele de stare a paginii, sunt imprimate și alte atribute (cum ar fi cele care indică citire, scriere și execuție) Cele KB de sus și KB de memorie sunt întotdeauna libere astfel încât să poată fi găsite erori de indicator (indicatorii neinițializați sunt adesea sau - ) Fiecare pagină alocată are o pagină umbră pe disc unde este stocată atunci când nu este în memoria principală Paginile gratuite și rezervate nu au pagini umbră, deci accesul la ele cauzează erori de pagină (sistemul nu poate prelua o pagină de pe disc dacă pagina nu este pe disc) Paginile umbră de pe disc sunt grupate în unul sau mai multe fișiere de pagină Sistemul de operare ține evidența căreia parte a fișierului de pagină se mapează fiecare pagină virtuală Fișierele cu texte de program au pagini umbră; paginile de date folosesc fișiere de pagină speciale Windows , ca și System V, permite ca fișierele să fie mapate direct în regiunile spațiului de adrese virtuale Dacă un fișier este mapat într-un spațiu de adresă, acesta poate fi citit sau scris în utilizând accesările normale de memorie Fișierele mapate în memorie sunt implementate în același mod ca și alte pagini alocate, doar paginile umbră pot fi într-un fișier disc, nu într-un fișier de pagină Ca urmare, atunci când fișierul este afișat, este posibil ca versiunea din memorie să nu se potrivească cu versiunea de pe disc (din cauza scrierilor recente în spațiul de adrese virtuale) Cu toate acestea, atunci când maparea fișierului este eliminată, versiunea de pe disc este actualizată Windows permite ca două sau mai multe procese să mapeze același fișier în același timp, eventual la adrese virtuale diferite Citind cuvinte din memorie și scriind cuvinte în memorie, procesele pot comunica între ele și pot transfera date în ambele direcții la o viteză suficient de rapidă, deoarece nu este necesară copierea Procesele diferite pot avea permisiuni de acces diferite Toate procesele care lucrează pe un fișier mapat partajează aceleași pagini, astfel încât modificările făcute de unul dintre procese sunt vizibile pentru toate celelalte procese, chiar dacă fișierul de pe disc nu a fost încă actualizat API-ul Win conține o serie de funcții care permit unui proces să gestioneze direct memoria virtuală Cele mai importante dintre aceste funcții sunt enumerate în Tabelul Toate rulează într-o zonă care constă fie dintr-o singură pagină, fie din două sau mai multe pagini situate secvenţial în spaţiul de adrese virtuale Tabelul Principalele funcții API pentru gestionarea memoriei virtuale în Windows XP Descrierea funcției API Rezervare VirtualAlloc sau alocarea domeniului VirtualFree Eliberarea unei zone sau deselectarea VirtualProtect Schimbați opțiunea de protecție (citire/scriere/execuție) VirtualQuery Interogare despre starea unei zone de memorie VirtuaILlock Dezactivează paginarea memoriei (zona de memorie devine rezidentă) VirtualUnlock Deblocare paginare Funcție API ('rratcFileMapping Descriere Creați un obiect de mapare a fișierului și atribuiți-i (nu întotdeauna) un nume MapViewOfFile Mapează un fișier sau o parte a unui fișier într-un spațiu de adrese J iunapViewOfFile Eliminați fișierul mapat din spațiul de adrese OpenFileMapping Deschideți un obiect de mapare fișier creat anterior Primele patru funcții sunt evidente Următoarele două funcții permit unui proces să creeze până la de pagini rezidente în memorie și să anuleze acea acțiune Această calitate poate fi necesară pentru programele care rulează în timp real Sistemul de operare stabilește o anumită limită pentru ca procesele să nu devină prea „lacom” Windows oferă și funcții API (nu sunt enumerate în Tabelul ) care permit unui proces să acceseze memoria virtuală a altui proces care se află sub controlul său (adică pentru care are un handle) Ultimele funcții API sunt pentru gestionarea fișierelor mapate în memorie Pentru a mapa un fișier, mai întâi trebuie să creați un obiect de mapare a fișierului folosind funcția CreateFileMapping Această funcție returnează un handle la obiectul de mapare a fișierului și, uneori, introduce și un nume pentru obiect în sistemul de fișiere, astfel încât un alt proces să îl poată utiliza Următoarele două funcții creează și, respectiv, elimină mapările fișierelor Ultima funcție este necesară pentru a afișa un fișier care este afișat în prezent de un alt proces Astfel, două sau mai multe procese pot partaja părți din spațiile lor de adrese Aceste funcții API sunt principalele Restul sistemului de management al memoriei este construit pe ele De exemplu, există funcții API pentru alocarea și eliberarea structurilor de date pe unul sau mai multe heap-uri Mulțile sunt folosite pentru a stoca structuri de date care sunt create și distruse dinamic Mulțile nu sunt dealocate în timpul colectării gunoiului, astfel încât software-ul utilizatorului trebuie să dealocați blocuri de memorie virtuală care nu mai sunt necesare (colectarea gunoiului se referă la eliminarea automată a structurilor de date neutilizate) Heap-ul Windows seamănă cu rezultatul unui apel UNIX malloc, dar în Windows XP, spre deosebire de* UNIX, pot exista mai multe heap-uri independente Exemple de I/O virtuale Orice sistem de operare este conceput în primul rând pentru a servi programele utilizatorului, iar serviciile principale sunt I/O de fișiere Atât UNIX, cât și Windows XP oferă o gamă largă de servicii I/O Există un apel echivalent pentru majoritatea apelurilor de sistem UNIX în Windows , dar inversul nu este adevărat deoarece Windows acceptă mult mai multe apeluri și fiecare este mult mai complex decât apelul UNIX corespunzător I/O virtuală în UNIX Sistemul UNIX este foarte popular, în mare parte datorită simplității sale, care, la rândul său, este un rezultat direct al organizării sistemului de fișiere Un fișier normal este o secvență liniară de octeți de biți de la la r) - maxim Sistemul de operare în sine nu implică nicio structură specifică de înregistrare a fișierelor, deși multe programe de utilizator tratează fișierele text ASCII ca secvențe de linii, fiecare dintre acestea se termină cu un caracter newline Cu fiecare fișier deschis este asociat un indicator către următorul octet care trebuie citit sau scris Sistemul de citire și scriere apelează date de citire și scriere începând de la poziția specificată de indicator După operație, ambele apeluri mută indicatorul într-o altă poziție, mutându-l exact cu numărul de octeți care au fost citiți sau scrisi Accesul aleatoriu la fișiere este posibil și atunci când indicatorul fișierului este setat la o anumită valoare Pe lângă fișierele obișnuite, sistemul acceptă fișiere speciale care sunt utilizate pentru a accesa dispozitivele I/O Fiecare dispozitiv I/O are de obicei unul sau mai multe fișiere speciale asociate cu el Citind informații din aceste fișiere și scriind informații în aceste fișiere, programul poate primi informații de la dispozitivul I/O și poate transmite informații către dispozitivul I/O Așa funcționează cu discuri, imprimante, terminale și multe alte dispozitive Principalele apeluri de sistem pentru fișiere în UNIX sunt date în tabel Apelul la creat (fără e obișnuit la sfârșit) este folosit pentru a crea un fișier nou În prezent, nu este necesar deoarece apelul deschis creează și un fișier nou Apelarea dezlegarii elimină fișierul (presupunând că fișierul există într-un singur director) Tabelul Apeluri sistem UNIX de bază Apel de sistem Descriere creat(nume, mod) Creare fișier; parametrul mode definește modul de protecție unlink(name) Ștergeți un fișier (presupunând că are o singură legătură) open(name, mode) Deschide sau creează un fișier și returnează un descriptor de fișier close(fd) Închide un fișier read(fd, buffer, count) Citiți din fișierul numără octeți în buffer write(fd, buffer, count) Scrie numărul de octeți din buffer în fișier lseek(fd, offset, w) Mutați indicatorul fișierului la valorile specificate de parametrii offset și \v stat(nume, buffer) Returnează informații despre un fișier chmod(namc, mode) Schimbați modul de protecție a fișierelor fcntl(fd, cmd, ) Efectuați diverse operații de control (cum ar fi blocarea unui fișier sau a unei părți a acestuia) Apelul deschis este folosit pentru a deschide fișiere existente, precum și pentru a crea altele noi Indicatorul de mod indică cum să îl deschideți (pentru citire, pentru scriere Pentru mulți, cuvintele despre octeți de biți pot părea ciudate, dar în trecut, un octet putea fi într-adevăr - atât pe cât și pe biți Acum, din obișnuință, credem că într-un octet există exact biți - Notă științific ed și g d ) Apelul returnează un mic întreg numit descriptor de fișier Descriptorul de fișier identifică fișierul la apelurile ulterioare Procesul I/O în sine este efectuat prin apeluri de citire și scriere, fiecare dintre acestea primește un descriptor de fișier ca parametri (indică ce fișier să folosească), un buffer pentru date și numărul de octeți transferați Apelul Iseek este folosit pentru a muta indicatorul fișierului, făcând posibilă accesarea unei locații arbitrare din fișier Apelul stat returnează informații despre fișier (dimensiune, ora ultimului acces, numele proprietarului etc ), apelul chmod modifică modul de protecție al fișierului (de exemplu, permite sau, dimpotrivă, interzice unor utilizatori să-l citească), în cele din urmă, Apelul fcntl permite efectuarea diferitelor acțiuni asupra fișierului, cum ar fi blocarea sau deblocarea Lista arată cum funcționează procesul I/O Acesta este un program minim care nu include niciun cod de verificare a erorilor Înainte de a intra în buclă, programul deschide fișierul de date existent și creează un nou fișier newf Fiecare apel returnează un descriptor de fișier infd sau, respectiv, outfd Următorul parametru din ambele apeluri sunt biții de protecție, care determină ca fișierele să fie citite și, respectiv, scrise Ambele apeluri returnează un descriptor de fișier Dacă apelul deschis sau creat eșuează, este returnat un descriptor de fișier negativ Lista Un fragment de program pentru copierea unui fișier utilizând apeluri de sistem UNIX Acest fragment este scris în C, deoarece Java nu poate afișa apelurile de sistem de nivel scăzut de care avem nevoie /♦ Obțineți un descriptor de fișier */ infd = open("date", ); outfd = creat("newf", ProtectionBits); /♦ Copiere ciclu */ face { count = read(infd, buffer, bytes); if (count > ) write(outfd, buffer, count); } în timp ce (număr > ); /♦ Închide fișierele */ close(infd); close(outfd); Apelul de citire are trei parametri: un descriptor de fișier, un buffer și un număr de octeți Acest apel trebuie să citească numărul necesar de octeți din fișierul specificat în buffer Numărul de octeți citiți este plasat în variabila de numărare Valoarea numărului poate fi mai mică de octeți dacă fișierul este prea scurt Apelul de scriere copiază octeții citiți în fișierul de ieșire Bucla continuă până când fișierul de intrare a fost citit complet Apoi bucla se termină și ambele fișiere sunt închise Descriptorii de fișiere în UNIX sunt numere întregi mici (de obicei până la ) Descriptorii de fișiere , și corespund intrării standard, ieșirii standard și, respectiv, erorii standard De obicei, primul este pentru tastatură, iar al doilea și al treilea pentru afișaj, deși utilizatorul poate redirecționa orice flux I/O standard i "leeeeei w * / rioipv kJi n fișier Multe programe UNIX preiau intrarea de la intrarea standard și scriu ieșirea la ieșirea standard Astfel de programe se numesc filtre Strâns legat de sistemul de fișiere este sistemul de directoare Fiecare utilizator poate avea mai multe directoare, iar fiecare director poate conține fișiere și subdirectoare Un sistem UNIX este de obicei configurat cu un director cd* principal, așa-numitul director rădăcină, care conține subdirectoare bin (pentru programele utilizate frecvent), dev (pentru fișiere speciale de dispozitiv I/O), lib (pentru biblioteci) și usr (pentru directoarele de utilizatori, după cum se arată în Figura ) În exemplul nostru, directorul usr conține subdirectoarele ast și jim Directorul ast include două fișiere (data și foo c) și un subdirector bin care conține fișiere (gamei, game , ) Pentru a accesa un fișier, trebuie să specificați calea acestuia din directorul rădăcină Calea conține o listă a tuturor directoarelor de la directorul rădăcină la fișier, separate printr-o bară oblică (/) De exemplu, calea către fișierul game este /usr/ast/bin/game O cale care începe la directorul rădăcină se numește cale absolută În orice moment, fiecare program care rulează are un director curent Calea poate fi legată de directorul curent În acest caz, nu există nicio bară oblică la începutul căii (pentru a o distinge de o cale absolută) O astfel de cale se numește cale relativă Dacă /usr/ast este directorul curent, atunci fișierul game poate fi accesat folosind calea bin/game Utilizatorul poate crea o legătură către fișierul altcuiva utilizând apelul de sistem de legătură În exemplul nostru, căile /usr/ast/bin/game și /usr/jim/jotto conduc la același fișier Nu este permisă aplicarea de legături către directoare pentru a preveni ciclurile în sistemul de directoare Apelurile deschise și create pot folosi căi absolute sau relative Principalele apeluri pentru manipularea directoarelor UNIX sunt enumerate în Tabelul Apelarea mkdir creează un director nou, iar rmdir elimină un director gol existent Următoarele trei apeluri sunt folosite pentru a citi intrările din director Primul deschide directorul, al doilea citește elemente din acesta, al treilea închide directorul Apelarea chdir schimbă directorul curent Tabelul Apeluri de bază pentru lucrul cu directoare pe un sistem UNIX Apel de sistem Descriere mkdir(nume, mod) Creați un director nou rmdir(nume) Eliminați un director gol Opendir(nume) Deschide un director pentru citire readdir(dirpointer) Citiți următorul element dintr-un director Closedir(dirpointer) Închide un director chdir(dirname) Schimbați directorul curent în directorul numit dirname link(name, name ) Creați un link (nume intrare în directorul care indică directorul namel) unlink(name) Eliminați o legătură (element cale) dintr-un director Directorul rădăcină Orez Un fragment din sistemul de directoare al sistemului de operare UNIX Apelul la link creează o intrare de director care indică un fișier existent De exemplu, elementul /usr/jim/jotto poate fi creat apelând: link("/usr/ast/bin/game ", "/usr/jim/jotto") Același rezultat poate fi obținut printr-un apel echivalent cu o cale relativă care depinde de directorul curent Apelarea deconectarii elimină elementul director Dacă fișierul are o singură legătură, acesta este șters Dacă un fișier are două sau mai multe legături, atunci nu este șters Nu contează dacă legătura de la distanță a fost creată inițial sau dacă este o copie Următorul apel face ca fișierul game să fie disponibil numai prin calea /usr/jim/jotto: unlink("/usr/ast/bin/game ") Apelurile de conectare și de deconectare pot fi folosite pentru a „muta” fișiere dintr-un director în altul Fiecare fișier (și, de asemenea, fiecare director, deoarece un director este și un fișier) are asociat un bitmap care spune cui are permisiunea de a accesa fișierul Cardul conține trei câmpuri RWX (Read, Write, eXecute - citire, scriere, execuție) Primul dintre ei controlează permisiunea de a citi, scrie și executa fișiere pentru proprietarul lor, al doilea - pentru alți utilizatori din grupul proprietarului, al treilea - pentru toți ceilalți utilizatori De exemplu, biții RWX RX -X înseamnă că proprietarul fișierului poate citi acest fișier, scrie ceva în el și îl poate executa (evident, fișierul este un program executabil, altfel nu ar exista permisiunea de a-l executa), altele membrii grupului pot să citească și să o facă, iar toți ceilalți doar o fac Astfel, utilizatorii neautorizați vor putea executa acest program, dar nu îl vor putea fura (copia), întrucât le este interzis să îl citească Includerea utilizatorilor în anumite grupuri este efectuată de administratorul de sistem, care este de obicei numit utilizator privilegiat Un utilizator privilegiat are dreptul de a acționa împotriva mecanismului de protecție și de a citi, scrie și executa orice fișier Acum să vedem cum sunt implementate fișierele și directoarele în sistemul UNIX Vezi [Vahalia, ] pentru o descriere mai detaliată Fiecare fișier (și fiecare director, deoarece un director este și un fișier) are asociat un bloc de informații de de octeți numit inode (i-node) Inodul conține informații despre cine deține fișierul, ce este permis să se facă cu fișierul, unde se găsesc datele etc etc Inodele pentru fișiere sunt situate fie secvențial la începutul discului, fie, dacă discul este împărțit în grupuri de cilindri, la începutul grupului Inodele sunt prevăzute cu numere consecutive Astfel, un sistem UNIX poate localiza un inod pur și simplu calculându-i adresa pe disc O intrare de director constă din două părți: un nume de fișier și un număr de inod Când programul execută următoarea comandă, sistemul caută în directorul curent al fișierului foo c pentru a găsi numărul inodul fișierului: deschide("foo c"j ) După ce a găsit numărul inodul, programul îl poate citi și afla toate informațiile despre fișier Dacă calea fișierului este mai lungă, procedura se repetă de mai multe ori până când întreaga cale a fost parcursă De exemplu, pentru a găsi numărul inodului pentru calea /usr/ast/data, sistemul caută mai întâi directorul rădăcină pentru elementul usr Odată ce găsește inodul usr, poate citi fișierul (un director pe un sistem UNIX este, de asemenea, un fișier) În acest fișier, ea va găsi elementul ast și va plăti Obține numărul inodul pentru /usr/ast Citind informațiile despre locație din directorul /usr/ast, sistemul va putea localiza intrarea pentru date și, prin urmare, numărul i-nodului pentru /usr/ast/data Găsind numărul de index) al descriptorului pentru acest fișier, sistemul poate obține orice informații despre acest fișier Formatul, conținutul și plasarea inodurilor variază ușor de la sistem la sistem (mai ales când vine vorba de sistemele în rețea), dar următoarele elemente sunt prezente în aproape fiecare inod: - tip de fișier, trei câmpuri RWX (total biți) și alți câțiva biți; + numărul de link-uri către fișier (număr de intrări în director); + ID proprietar; - grupul proprietarului; + lungimea fișierului în octeți; - treisprezece adrese de disc; - ora la care fișierul a fost citit ultima dată; + ora la care a fost scris ultima dată fișierul; este ora la care inodul a fost schimbat ultima dată Tipurile de fișiere posibile sunt fișiere obișnuite, directoare, două tipuri de fișiere speciale pentru dispozitive de I/O bloc și brute Am discutat deja despre numărul de link-uri și ID-ul proprietarului Lungimea fișierului este exprimată ca un număr întreg de de biți reprezentând octetul înalt al fișierului Este complet posibil să creați un fișier, să mutați indicatorul în poziția și să scrieți octet Rezultatul este un fișier cu o lungime de În acest caz, fișierul nu necesită salvarea tuturor octeților „inexistenți” Primele adrese de pe disc indică blocuri de date Dacă dimensiunea blocului este de de octeți, atunci puteți lucra cu fișiere de până la de octeți Adresa indică un bloc indirect care conține adrese suplimentare Cu un bloc de de octeți și adrese de de biți, conține de adrese Acest lucru vă permite să lucrați cu fișiere de până la + x -= octeți Pentru fișiere și mai mari, există adresa , care indică de blocuri indirecte Aici, dimensiunile fișierelor permise sunt + x x = octeți Dacă această schemă de blocuri cu dublă indirectă este prea mică, se folosește adresa Ea indică blocul cu triplă indirectă, care conține adresele a de blocuri cu dublu indirectă Folosind adresarea directă, indirectă, dublă indirectă și triplă indirectă, pot fi accesate blocuri Aceasta înseamnă că dimensiunea maximă posibilă a fișierului este de de octeți Dacă se folosesc adrese de de biți în loc de adrese de de biți, iar dimensiunea blocului este de KB, fișierele pot fi foarte, foarte mari Blocurile de disc libere sunt stocate ca o listă legată Dacă este necesar un nou bloc, acesta este luat din listă Rezultatul este că blocurile fiecărui fișier sunt împrăștiate aleatoriu pe disc Pentru a îmbunătăți viteza I/O pe disc, atunci când un fișier este deschis, inodul acestuia este copiat în tabelul de memorie principal și stocat acolo atâta timp cât fișierul rămâne deschis În plus, un set de blocuri este stocat în memorie, care au fost abordate recent Deoarece majoritatea fișierelor sunt citite secvențial, un acces la fișier necesită adesea același bloc ca și accesul anterior Pentru a crește viteza, sistemul citește următorul bloc într-un fișier chiar înainte de a fi accesat Toate aceste momente sunt ascunse utilizatorului Când utilizatorul emite un apel de citire, programul se întrerupe până când datele necesare apar în buffer Știind toate acestea, puteți înțelege cum are loc procesul I/O Apelarea eagle face ca sistemul să caute directoare într-o anumită cale Dacă căutarea are succes, inodul este citit în tabelul intern Apelurile de citire și scriere necesită ca sistemul să calculeze numărul blocului din poziția curentă a fișierului Adresele primelor blocuri de disc sunt întotdeauna în memoria principală (inode); pentru blocurile rămase, trebuie mai întâi citite unul sau mai multe blocuri de adresare indirectă Apelul către Iseek schimbă pur și simplu poziția curentă a indicatorului și nu face I/O De asemenea, este ușor de înțeles implementarea apelurilor de conectare și deconectare Primul argument pentru apelul de legătură este numărul inodului La acel număr, creează o intrare de director pentru al doilea argument și plasează numărul i-node al primului fișier în acea intrare de director În cele din urmă, crește numărul de legături din inod cu unul Apelarea dezlegarii elimină intrarea în director și reduce numărul de legături din inod Dacă acest număr devine , fișierul este șters și toate blocurile sale sunt plasate pe lista liberă I/O virtuală în Windows Windows XP acceptă mai multe sisteme de fișiere, dintre care cele mai importante sunt NTFS (NT File System) și FAT (File Allocation Table) Primul a fost conceput special pentru Windows XP Al doilea este un sistem de fișiere moștenit pentru MS-DOS, care este folosit și de Windows / (deși cu nume de fișiere lungi) Deoarece sistemul FAT este învechit și se găsește acum doar în unitățile USB și cardurile de memorie, vom lua în considerare doar sistemul de fișiere NTFS Pe NTFS, un nume de fișier poate avea până la de caractere Numele fișierelor sunt scrise în Unicode, astfel încât persoanele din diferite țări care nu folosesc alfabetul latin să poată scrie numele fișierelor în propria lor limbă Mai mult, Unicode este folosit intern de Windows ; în toate versiunile sistemului de operare, începând cu Windows , textele meniurilor, mesajele de eroare și alte elemente de interfață sunt stocate în fișiere de configurare alocate fiecărei limbi, în timp ce fișierele binare sunt aceleași pentru toate variantele mediului de limbă Pe NTFS, literele mari și mici din numele fișierelor sunt considerate diferite (adică „foo” este diferit de „FOO”) Din păcate, API-ul Win nu face distincție între literele majuscule și mici în numele fișierelor și directoarelor, astfel încât acest avantaj este pierdut pentru programele care utilizează subsistemul Win Ca și în UNIX, un fișier este o secvență liniară de octeți cu o lungime maximă de - Există și pointerii, dar sunt de de biți în loc de , astfel încât lungimea maximă a fișierului poate fi menținută Apelurile de funcții din API-ul Win pentru manipularea directoarelor și fișierelor sunt, în general, similare cu apelurile de funcții UNIX, dar majoritatea exemple de sisteme de operare au mai multi parametroni si un alt model de protectie La deschiderea unui fișier, este returnat un handle, care este apoi folosit pentru a citi și scrie fișierul Spre deosebire de UNIX, descriptorii nu sunt numere întregi mici, deoarece sunt utilizați pentru a identifica obiectele nucleului, care pot fi de milioane Principalele funcții API Win pentru gestionarea fișierelor sunt enumerate în Tabelul Tabelul Funcții de bază Win API pentru fișiere I/O Funcție API UNIX Analog Descriere CreateFile open Creați un fișier sau deschideți un fișier existent; funcția returnează mânerul DeleteFile deconectare Șterge un fișier existent CloseHandle close Închide un fișier Citire Citire fișier Citire date dintr-un fișier WriteFile write Scrie date într-un fișier SetFilePointer Iseek Setați un indicator de fișier la o locație dată dintr-un fișier Setați atributele fișierului stat Returnează proprietățile fișierului LockFile Fcntl Blocați o regiune a unui fișier pentru a oferi excluderea reciprocă a accesului UnlockFile Fcntl Deblochează o zonă blocată anterior a unui fișier Să aruncăm o privire asupra acestor provocări Apelul CreateFile este folosit pentru a crea un fișier nou și le returnează un handle Această funcție este folosită și pentru a deschide un fișier deja existent, deoarece nu există nicio funcție heads în API Nu vom enumera parametrii funcțiilor API, deoarece există o mulțime de ei De exemplu, funcția CreateFile are șapte parametri: + pointer către numele fișierului creat sau deschis; - steaguri care spun ce acțiuni pot fi efectuate cu fișierul (citire, scriere sau ambele); + steaguri care indică dacă mai multe procese pot deschide un fișier în același timp; + un pointer către un descriptor de securitate care indică cine are acces la fișier; + steaguri care indică ce trebuie făcut atunci când fișierul există sau nu există; + steaguri asociate cu atribute de arhivare, compresie etc ; + descriptor de fișier ale cărui atribute urmează să fie clonate pentru noul fișier Următoarele șase funcții API sunt similare cu funcțiile UNIX corespunzătoare Cu toate acestea, rețineți că I/O în Windows este asincron, deși un proces poate aștepta finalizarea operației Ultimele două funcții vă permit să blocați sau să deblocați o regiune a unui fișier pentru a vă asigura că procesele nu pot accesa aceeași regiune Folosind aceste funcții API, puteți scrie o procedură pentru copierea unui fișier, similar cu procedura din lista O astfel de procedură (fără codul de verificare a erorilor) este prezentată în Lista În practică, nu este nevoie să scrieți un program pentru a copia un fișier, deoarece există o funcție CopyFile care face aproximativ același lucru și este implementată ca procedură de bibliotecă Lista Un fragment dintr-un program pentru copierea unui fișier folosind funcția API Windows Acest fragment este scris în C, deoarece Java nu poate afișa apelurile de sistem de nivel scăzut de care avem nevoie /* Deschide fișierele pentru intrare și ieșire */ inhandle = CreateFileC'data", GENERIC READ, , NULL, OPEN EXISTING, , NULL); outhandle = CreateFileC'newF, GENERIC WRITE, Q, NULL, CREATE ALWAYS, FILE ATTRIBUTE NORMAL, NULL); /* Copiați fișierul */ face { s = ReadFile(inhandle, buffer, BUF SIZE, &count, NULL); if (s > && count > ) WriteFile(outhandle, buffer, count, &ocnt, NULL); } în timp ce (s > && numără > ); /* Închiderea fișierelor ♦/ CloseHandle(inhandle); CloseHandle (mâner exterior); Windows acceptă un sistem de fișiere ierarhic care seamănă cu sistemul de fișiere UNIX Cu toate acestea, separatorul de aici nu este o bară oblică înainte, ci o bară oblică inversă (împrumutat de la MS-DOS) Și aici există conceptul de director curent, iar căile pot fi absolute și relative Cu toate acestea, există o diferență semnificativă între Windows XP și UNIX UNIX vă permite să montați sisteme de fișiere de pe diferite discuri și mașini într-un singur arbore, ascunzând astfel structura discului de programe Windows XP nu are această capacitate, așa că numele absolute de fișiere trebuie să înceapă cu o literă de unitate (de exemplu, C:\windows\system\foo dll) În același timp, începând cu Windows , a fost implementată capacitatea de a monta sisteme de fișiere în stil UNIX Principalele funcții pentru lucrul cu directoare sunt listate în Tabel (de asemenea, împreună cu echivalentele UNIX) Probabil că sensul acestor funcții se explică de la sine Tabelul Funcțiile de bază ale Win API pentru lucrul cu directoare Funcția API Funcția UNIX Semnificație CreateDirectiry mkdir Creați un director nou RemoveDirectory rmdir Eliminați un director gol FindFirstFile opendir Începeți să citiți intrările din director FindNextFile readdir Citiți următoarea intrare dintr-un director MoveFile Mută un fișier dintr-un director în altul SctCurrentDirectory chdir Schimba directorul curent Windows XP are un mecanism de securitate mai sofisticat decât UNIX Deși LPI conține sute de funcții legate de securitate, următoarea descriere este cel puțin o idee generală Când un utilizator se conectează, pro-cp-ul său primește un token de acces de la sistemul de operare Indicatorul de acces conține un identificator de securitate (Security D, SID), o listă de grupuri din care aparține utilizatorul, privilegii disponibile și alte informații Tokenul de acces concentrează toate informațiile de securitate într-un singur loc ușor accesibil Toate procesele create de acest proces moștenesc același simbol de acces Un descriptor de securitate este unul dintre parametrii dați oricărui obiect la creare Descriptorul de securitate conține o listă de elemente numită Listă de control al accesului (ACL) Fiecare element permite sau interzice un anumit set de operațiuni cu obiectul oricărui utilizator sau grup De exemplu, un fișier poate conține un descriptor de securitate care specifică că Ivanov nu are deloc acces la fișier, Petrov poate citi fișierul, Sidorov poate citi și scrie fișierul și toți membrii grupului XYZ pot citi doar dimensiunea de fișierul Dacă un proces încearcă să efectueze orice operațiune asupra unui obiect folosind mânerul primit la deschiderea obiectului, managerul de securitate obține jetonul de acces al procesului și compară nivelul de integritate al descriptorului de securitate al obiectului cu nivelul de integritate al jetonului Un proces nu poate obține un token cu permisiuni de scriere pentru un obiect cu un nivel de integritate mai ridicat Nivelurile de integritate sunt utilizate în principal pentru a limita capacitatea unui sistem de a fi modificat prin codul încărcat într-un browser web După verificarea nivelului de integritate, managerul de securitate începe să parcurgă elementele listei de control acces în ordine De îndată ce găsește un element care se potrivește utilizatorului dorit sau unuia dintre grupuri, informațiile găsite despre permiterea sau refuzarea accesului sunt considerate ca date Din acest motiv, elementele care interzic accesul sunt de obicei plasate în lista de control al accesului înaintea elementelor care permit accesul (pentru a împiedica un utilizator care nu are acces să obțină acces ilegal, fiind membru al unuia dintre grupurile cărora li se permite accesul) Descriptorul de securitate conține, de asemenea, informații utilizate pentru auditarea acceselor la obiect Acum să aruncăm o privire amplă asupra implementării fișierelor și directoarelor în Windows Fiecare disc este împărțit în volume, la fel ca partițiile de disc UNIX Fiecare volum conține fișiere, hărți de biți de director și alte structuri de date Fiecare volum este organizat ca o secvență liniară de clustere Mărimea clusterului este fixă pentru fiecare volum Poate fi de la octeți la KB, în funcție de dimensiunea volumului Clusterul este accesat prin offset de la începutul volumului Aceasta utilizează numere pe de biți Structura principală de date din fiecare volum este Master File Table (MFT), care conține intrări pentru fiecare fișier și director din volum Aceste intrări sunt similare cu intrările inode (i-node) în UNIX Tabelul de fișiere master este un fișier și poate fi plasat oriunde într-un volum Aceasta rezolvă o problemă care apare atunci când se găsesc blocuri de disc proaste printre inoduri Tabelul principal al fișierelor este prezentat în fig Opa începe cu un antet care oferă informații despre volum (indicatori către directorul rădăcină, fișier descărcări, o listă de persoane care folosesc acces gratuit etc ) Apoi, există o intrare per fișier sau director ( KB dacă dimensiunea clusterului este de KB sau mai mult) Fiecare element conține toate metadatele (informații administrative) despre un fișier sau director Sunt permise mai multe formate, dintre care unul este prezentat în Fig Master File Table (MFT) Orez Tabelul Master File în Windows Câmpul de informații standard conține informații despre marcajele de timp cerute de standardele POSIX, numărul de legături, biți de doar citire, biți de arhivare etc Acest câmp are o lungime fixă și este obligatoriu Numele fișierului poate avea orice lungime, până la de caractere Unicode Pentru a face astfel de fișiere accesibile pentru programele moștenite pe biți, li se poate atribui un alias MS-DOS de până la caractere, urmat de un punct și o extensie de trei caractere Dacă numele propriu-zis al fișierului urmează convenția de denumire MS-DOS ( + ), numele de mijloc în stil MS-DOS nu este utilizat Urmează domeniul de securitate În toate versiunile anterioare Windows NT , câmpul de securitate conținea un descriptor de securitate Începând cu Windows , toate informațiile de securitate sunt plasate într-un singur fișier, iar câmpul de securitate indică pur și simplu partea corespunzătoare a acelui fișier Pentru fișierele mici, datele reale ale acelor fișiere pot fi conținute într-o intrare de tabel de fișiere master, făcându-le mai ușor de apelat fără a necesita acces la disc Acest concept se numește fișierul imediat [Mullender și Tanenbaum, ] Pentru fișierele mari, acest câmp conține pointeri către clustere de date sau (mai frecvent) către blocuri de clustere consecutive, astfel încât numărul și lungimea clusterului pot reprezenta o cantitate arbitrară de date Dacă elementul tabelului de fișiere principal nu este suficient de mare pentru a stoca informațiile necesare, unul sau mai multe elemente suplimentare (înregistrări) îi pot fi asociate Dimensiunea maximă a fișierului este de de octeți Să explicăm ce este un fișier de această dimensiune Să ne imaginăm că fișierul este scris în sistem binar și fiecare sau ocupă mm de spațiu Valoarea de ’ mm corespunde valorii de ani lumină Acest lucru ar fi suficient pentru a trece dincolo de sistemul solar, a ajunge la Alpha Centauri și a reveni înapoi Sistemul de fișiere NTb are multe alte caracteristici interesante, cum ar fi compresia datelor și toleranța la erori ale tranzacțiilor atomice Informații suplimentare pot fi găsite în (Russinovici și Solomon, Exemple de control al procesului Sistemele Windows și UNIX vă permit să împărțiți o lucrare în mai multe procese care rulează (pseudo-) în paralel și comunică între ele, ca în exemplul producător/consumator despre care am discutat mai devreme În această subsecțiune, vom vorbi despre modul în care procesele sunt gestionate în ambele sisteme Ambele sisteme suportă paralelismul într-un singur proces folosind fire de execuție de program și vom vorbi și despre asta Managementul proceselor în UNIX În orice moment, un proces UNIX poate crea un subproces care este copia lui exact Pentru a face acest lucru, este executat apelul de sistem for k Procesul original se numește părinte, iar cel nou se numește copil Cele două procese rezultate din apelul for to sunt exact identice și chiar împărtășesc aceiași descriptori de fișier Cu toate acestea, fiecare dintre aceste două procese își desfășoară activitatea independent de celălalt Adesea, procesul copil manipulează descriptori de fișiere într-un fel și apoi execută apelul de sistem exec, care înlocuiește programul și datele cu programul și datele din fișierul executabil specificat ca parametru de apel exec De exemplu, dacă utilizatorul introduce comanda xyz, atunci interpretul de comandă (shell) efectuează o operație de furcăre, generând astfel un proces copil Și acest proces face un apel către exec pentru a rula programul xyz Aceste două procese rulează în paralel (cu sau fără apelul de sistem exec), dar uneori procesul părinte trebuie, dintr-un motiv oarecare, să aștepte ca procesul copil să-și finalizeze activitatea și abia apoi să continue să efectueze anumite acțiuni În acest caz, procesul părinte emite un apel de sistem wait sau waitpid, determinând suspendarea temporară și așteptarea până când procesul secundar emite apelul de sistem de ieșire Procesele ar putea face apelul de furcă ori de câte ori doresc, rezultând un întreg arbore de procese Uită-te la fig Aici, procesul A s-a bifurcat de două ori și a generat două procese noi, B și C Apoi, procesul B s-a bifurcat de două ori și procesul C o dată Astfel, s-a obținut un arbore de șase procese Procesul sursă Orez Arborele de proces în sistemul UNIX Procesele generate de procesul A Procese generate de procesele copil ale procesului A Procesele din UNIX pot comunica între ele printr-o structură specială de informații numită conductă O conductă este un fel de buffer în care un proces scrie un flux de date, iar un alt proces preia datele de acolo Octeții sunt întotdeauna returnați de la canal în ordinea în care au fost scrisi Accesul aleatoriu nu este posibil Canalele nu păstrează granițele dintre fragmentele de date, așa că dacă un proces a scris fragmente de de octeți pe canal, iar un alt proces citește date de de octeți, atunci al doilea proces va primi toate datele simultan fără a indica faptul că au fost scrise în câțiva pași System V și Linux folosesc o metodă diferită pentru comunicarea proceselor Aici sunt folosite așa-numitele cozi de mesaje Un proces poate crea o nouă coadă de mesaje sau poate deschide una existentă apelând msgget Mesajele sunt trimise folosind msgsnd și primite folosind msgrecv Mesajele trimise în acest fel sunt diferite de datele introduse într-un canal În primul rând, limitele mesajelor sunt păstrate, în timp ce canalul pur și simplu transmite un flux de octeți În al doilea rând, mesajele sunt prioritizate, așa că mesajele urgente vin înaintea tuturor celorlalte În al treilea rând, mesajele sunt tastate, iar apelarea msgrecv vă permite să determinați tipul lor, dacă este necesar Două sau mai multe procese pot împărtăși o zonă comună a spațiilor lor de adrese UNIX gestionează această memorie partajată prin maparea acelorași pagini la spațiul de adrese virtuale al tuturor proceselor partajate Ca rezultat, o scriere în zona partajată făcută de unul dintre procese va fi vizibilă pentru toate celelalte procese Acest mecanism oferă un debit foarte mare atunci când procesele interacționează Apelurile de sistem implicate în lucrul cu memoria partajată se numesc shmat și shmop O altă caracteristică a System V și Linux este prezența semaforelor Am descris deja principiile muncii lor în exemplul cu producătorul și consumatorul O altă caracteristică a sistemelor UNIX compatibile cu POSIX este suportul pentru mai multe fire de control într-un singur proces Aceste fluxuri de control sunt de obicei denumite pur și simplu fluxuri de program Sunt ca procesele care partajează un spațiu de adrese comun și toate obiectele asociate cu acel spațiu de adrese (descriptori de fișiere, variabile de mediu etc ) Cu toate acestea, fiecare fir de execuție are propriul său numărător de programe, propriile registre și propriul său stack Dacă unul dintre firele de execuție a programului este suspendat (de exemplu, până la finalizarea unui proces I/O), alte fire de execuție a programului din același proces pot continua să ruleze Două fire de execuție de program din același proces care acționează ca un proces producător și un proces consumator seamănă cu două procese cu un singur thread care împart un segment de memorie care conține un buffer, deși nu sunt identice În al doilea caz, fiecare proces are propriii descriptori de fișier etc , în timp ce în primul caz, toate aceste elemente sunt comune În exemplul producător-consumator, am văzut cum funcționează firele în Java Uneori, sistemul de rulare Java folosește un fir de execuție al sistemului de operare pentru a suporta fiecare dintre fire, dar acest lucru nu este necesar Când ai putea avea nevoie de fire de execuție de program? De exemplu, un server web poate stoca o memorie cache a paginilor web utilizate frecvent în memoria principală Dacă pagina dorită se află în cache, atunci aceasta este emisă imediat Dacă nu, atunci este apelat de pe disc Din păcate, acest lucru durează destul de mult (de obicei de milisecunde), timp în care procesul este blocat și nu poate servi cereri noi, chiar dacă paginile web solicitate sunt în cache Pentru a rezolva problema, puteți crea mai multe fire în același proces care partajează un cache comun al paginii web Dacă unul dintre firele de execuție a programului este blocat, cererile noi pot fi procesate de alte fire de execuție a programului Desigur, puteți preveni blocarea procesului fără a utiliza fire Acest lucru va necesita mai multe procese, dar apoi va trebui să duplicați memoria cache, iar aceasta este o utilizare ineficientă a memoriei Standardul de sistem UNIX pentru firele de execuție se numește pthreads și este definit în POSIX (P C) Descrie apeluri pentru gestionarea și sincronizarea firelor de execuție a programului Standardul nu spune dacă firele de execuție ar trebui gestionate de kernel sau ar trebui să funcționeze numai în spațiul utilizatorului Cele mai comune funcții pentru lucrul cu firele de execuție ale programului sunt prezentate în tabel Tabelul Funcții de bază pentru lucrul cu firele de execuție definite în standardul POSIX Descrierea funcției pthread crcate Creați un nou thread de program în spațiul de adrese al procedurii de apelare pthreadexit Închide un fir de execuție a unui program pthread join Așteptați ca firul de program să se termine pthread mutcx init Creați un nou mutex pthread mutex dcstroy Eliminați mutex pthread mutex lock pthread mutex deblocare pthread cond init Creați variabila de condiție pthread cond destroy Eliminați variabila de condiție pthread cond wait Așteptați o variabilă de condiție pthread cond signal Deblocați unul dintre firele de execuție care așteaptă o variabilă de condiție Să aruncăm o privire asupra acestor provocări Primul apel, pthread create, creează un nou thread de program După executarea acestei proceduri, în spațiul de adrese mai apare un fir de program Firul programului care și-a încheiat activitatea apelează funcția pthread exit Dacă un fir trebuie să aștepte ca un alt fir să se termine, apelează funcția pthread join Dacă celălalt thread și-a terminat deja munca, apelul pthread join se încheie imediat În caz contrar, este blocat Firele de execuție ale programului pot fi sincronizate folosind obiecte speciale numite mutex De obicei, un mutex controlează o anumită resursă (de exemplu, un buffer partajat între două fire de execuție a programului) Pentru ca un singur fir să acceseze o resursă partajată la un moment dat, firele de execuție trebuie să blocheze mutex-ul înainte de a utiliza resursa și să o deblocheze după ce au terminat cu ea În acest fel, condițiile de cursă pot fi evitate, deoarece toate firele de execuție se supun acestui protocol Mutexurile sunt similare cu semaforele binare (adică semaforele care pot lua doar două valori: sau ) Mutexurile sunt create și distruse de apelurile către pthread mutex init și, respectiv, pthread mutex destroy Un mutex poate fi în una din două stări: blocat sau deblocat Dacă un fir de execuție trebuie să blocheze un mutex deblocat, efectuează un apel către pthread mutex lock și apoi continuă Totuși, dacă un fir de execuție încearcă să blocheze un mutex deja blocat, firul de execuție este suspendat Când firul de execuție care utilizează în prezent resursa partajată a terminat de utilizat acea resursă, trebuie să deblocheze mutex-ul corespunzător apelând pthread mutex unlock Mutexurile sunt concepute pentru blocarea pe termen scurt (de exemplu, protejarea unei variabile partajate), dar nu pentru sincronizare pe termen lung (de exemplu, așteptarea ca o unitate de bandă să devină liberă) Pentru sincronizarea pe termen lung, există variabile de condiție Aceste variabile sunt create și distruse de apelurile către pthread cond init și, respectiv, pthread cond destroy O variabilă de condiție este asociată cu două fire de program: așteptare și semnalizare Dacă, de exemplu, un fir detectează că unitatea de bandă de care are nevoie este ocupată în prezent, acel fir emite un apel către pthread cond wait pe variabila condiție Când un fir care folosește o unitate de bandă își încheie lucrul cu acest dispozitiv (și acest lucru poate dura câteva ore), acesta semnalează acest lucru apelând pthread cond signal Acest lucru permite deblocarea exact unui fir - cel care așteaptă această variabilă de condiție Dacă nu există fire care să aștepte această variabilă, semnalul dispare Variabilele de condiție nu au un numărător, așa cum au semaforele Rețineți că alte operațiuni pot fi efectuate pe fire, mutex și variabile de condiție Managementul proceselor în Windows Windows acceptă comunicarea și sincronizarea între procese Fiecare proces conține cel puțin un fir de program Procesele și firele de execuție oferă în mod colectiv instrumente de control al concurenței pentru sistemele cu un singur procesor și multiprocesor Procesele noi sunt create folosind funcția CreateProcess API Această funcție are parametri, fiecare având multe valori posibile Evident, un astfel de sistem este mult mai complicat decât schema UNIX corespunzătoare, unde funcția fork nu are deloc argumente, iar exec are doar trei dintre ele: pointeri către numele fișierului executabil, către o serie de opțiuni ale liniei de comandă, și la o linie de descriere a configurației Cele argumente ale funcției CreateProcess sunt enumerate mai jos + pointer către numele fișierului executabil; + linia de comandă în sine (fără parsare); + pointer către descriptorul de securitate al acestui proces; + pointer către descriptorul de securitate al firului original al programului; + un pic care spune dacă noul proces moștenește mânerele de proces ale părintelui; + diverse steaguri (de ex erori, prioritate, depanare, console); + pointer către liniile de descriere a configurației; + pointer către numele directorului de lucru al noului proces; + un pointer către o structură care descrie fereastra sursă de pe ecran; + pointer către o structură care returnează valori la procedura de apelare În Windows , nu există o ierarhie a proceselor părinte-fiu Toate procesele sunt create egale Cu toate acestea, deoarece unul dintre cei parametri reveniți la procesul inițial este noul handle de proces (care permite controlul noului proces), există o ierarhie internă în sensul că alte handle de proces sunt disponibile pentru anumite procese Aceste mânere nu pot fi pur și simplu trecute unui alt proces, dar un proces poate face un anumit mâner disponibil unui alt proces și apoi să îi transmită acel mâner, astfel încât ierarhia procesului intern nu este permanentă Fiecare proces din Windows este creat cu un fir de program, ulterior acest proces poate crea mai multe astfel de fire Crearea unui fir de execuție de program este mai ușoară decât crearea unui proces, deoarece apelul CreateThread are doar parametri în loc de : descriptor de securitate, dimensiunea stivei, adresa de pornire, parametrul utilizatorului, starea inițială a firului (gata sau blocată) și ID-ul firului Deoarece nucleul este responsabil pentru crearea firelor de execuție, are informații despre toate firele de execuție a programului (cu alte cuvinte, implementarea lor nu se limitează la spațiul utilizatorului, ca în alte sisteme) În timpul procesului de planificare, nucleul apelează nu numai următorul proces de rulat, ci și firul de execuție al procesului Aceasta înseamnă că nucleul știe întotdeauna ce fire de execuție de program sunt blocate și care nu Întrucât firele de execuție sunt obiecte kernel, au descriptori și mânere de securitate Deoarece descriptorilor li se permite să fie transmise unui alt proces, este posibil ca un proces să gestioneze fluxurile de program ale altui proces Această caracteristică, de exemplu, este utilă pentru depanatori Procesele pot comunica între ele în mai multe moduri: prin conducte, conducte numite, sloturi de e-mail, socketuri, apeluri de procedură la distanță, fișiere partajate Canalele sunt împărțite în două tipuri: canale de octeți și canale de mesaje Tipul de canal este selectat în momentul creării Conductele byte funcționează la fel ca în UNIX Canalele de mesaje păstrează limitele mesajelor, astfel încât patru înregistrări de de octeți sunt citite de pe canal ca patru mesaje de de octeți (mai degrabă decât un mesaj de de octeți, așa cum este cazul canalelor de octeți) În plus, există țevi numite, care vin și în două soiuri Conductele numite* pot fi utilizate în rețea, dar conductele normale nu Prizele sunt similare cu țevile, dar de obicei conectează procese pe mașini diferite, deși pot fi folosite și pentru a conecta procese pe aceeași mașină nr În general, o conexiune priză nu este cu mult mai bună decât o conexiune obișnuită sau numită Apelurile de procedură de la distanță permit procesului A să instruiască procesul B să efectueze un apel de procedură în spațiul de adrese B în numele lui A și să returneze rezultatul procesului A Există diverse restricții privind parametrii apelului De exemplu, trecerea unui pointer către un alt proces nu are niciun sens În schimb, obiectul (obiectele) la care se referă indicatorul trebuie să fie încadrat în casetă și să fie transmis unui alt proces În cele din urmă, procesele pot partaja memoria partajată prin maparea simultană a aceluiași fișier în memorie Apoi, toate înregistrările generate de un proces vor apărea în spațiul de adrese al altor procese Folosind acest mecanism, putem implementa cu ușurință tamponul partajat pe care l-am descris în exemplu cu procesul de producător și procesul de consum Windows oferă multe mecanisme de sincronizare (semafore, mutexuri, secțiuni critice, evenimente) Toate aceste mecanisme nu funcționează cu procese, ci cu fire de execuție de program, așa că atunci când un fir de execuție se blochează pe un semafor, nu afectează în niciun fel alte fire de execuție ale acestui proces - ele continuă să funcționeze Un semafor este creat folosind funcția CreateSemaphore API, care îl poate seta la o anumită valoare și poate determina valoarea maximă a acestuia Semaforele sunt obiecte kernel, deci au descriptori de securitate și mânere Un mâner de semafor poate fi duplicat folosind funcția DuplicateHandle și transmis unui alt proces, astfel încât un singur semafor poate sincroniza mai multe procese Sunt acceptate și funcțiile sus și jos, deși au denumiri diferite: ReleaseSemaphore (pentru sus) și WaitForSingleObject (pentru jos) Puteți defini o limită de timp inactiv pentru funcția WaitForSingleObject, astfel încât firul apelant să poată fi deblocat în cele din urmă chiar dacă semaforul rămâne la (cu toate acestea, cronometrele contribuie la condițiile de cursă) Mutexurile sunt, de asemenea, obiecte nucleu, dar sunt mai simple decât semaforele deoarece nu au contor Sunt, de fapt, obiecte cu funcții API pentru blocare (WaitForSingleObject) și deblocare (ReleaseMutex) Mânerele Mutex, precum mânerele semaforului, pot fi duplicate și transmise altor procese, astfel încât firele din procese diferite să poată accesa același mutex Al treilea mecanism de sincronizare se bazează pe secțiuni critice Secțiunile critice sunt similare cu mutexurile, cu excepția localității lor în ceea ce privește spațiul de adresă al firului de execuție original al programului Deoarece secțiunile critice nu sunt obiecte kernel, ele nu au mânere sau descriptori de securitate, deci nu pot fi transmise altor procese Blocarea și deblocarea se realizează folosind funcțiile EnterCriticalSection și, respectiv, LeaveCriticalSection Deoarece aceste funcții API rulează în întregime în spațiul utilizatorului, sunt mult mai rapide decât mutexurile Ultimul mecanism este legat de utilizarea obiectelor kernel, care se numesc evenimente Dacă un fir trebuie să aștepte un eveniment, apelează WaitForSingleObject Cu funcția SetEvent, puteți debloca un fir în așteptare și cu funcția PulseEvent este în așteptare Există mai multe tipuri de evenimente care* au mai mulți parametri Evenimentele, mutexurile și semaforele pot fi denumite în mod specific și stocate în sistemul de fișiere ca conducte numite Puteți sincroniza funcționarea a două sau mai multe procese prin deschiderea aceluiași eveniment, mutex sau semafor În acest caz, nu trebuie să creeze un obiect și apoi să dubleze mânerele, deși această abordare este, de asemenea, posibilă Rezumatul capitolului Sistemul de operare poate fi gândit ca un interpret pentru unele caracteristici arhitecturale care nu sunt prezente la nivelul arhitecturii de comandă Principalele dintre acestea sunt memoria virtuală, instrucțiunile I/O virtuale și suportul pentru concurență Memoria virtuală este necesară pentru a permite programelor să utilizeze mai mult spațiu de adrese decât are mașina de fapt sau pentru a oferi un mecanism convenabil pentru protejarea și partajarea memoriei Memoria virtuală poate fi implementată prin paginare „pură”, segmentare „pură” sau ambele Cu memoria de paginare, spațiul de adrese este împărțit în pagini virtuale de dimensiuni egale Unele dintre ele sunt mapate pe cadre de pagină fizice, altele nu Referința la pagina mapată este tradusă de managerul de memorie în adresa fizică corectă Accesarea unei pagini nemapate cauzează o eroare de ieşire a paginii Atât Core I , cât și OMAP au manageri de memorie sofisticați care acceptă memoria virtuală și paginarea Cea mai importantă abstractizare I/O la acest nivel este fișierul Un fișier constă dintr-o secvență de octeți, sau înregistrări logice, care* pot fi citite și scrise fără a ști cum funcționează discurile și alte* dispozitive I/O Fișierele pot fi accesate secvenţial, arbitrar după numărul de înregistrare și arbitrar prin cheie Directoarele sunt folosite pentru a grupa fișiere Fișierele pot fi stocate în sectoare consecutive sau pot fi împrăștiate pe tot discul În acest din urmă caz, sunt necesare structuri speciale de date pentru a găsi toate blocurile din fișier Puteți utiliza o listă de goluri (zone neutilizate) sau un bitmap (bitmap) pentru a urmări spațiul liber de pe un disc Paralelismul este adesea susținut și implementat în sistemele uniprocesor prin partajarea timpului, care este modul în care sunt modelate procesoarele multiple Interacțiunea necontrolată a diferitelor procese poate duce la o condiție de rasă Pentru a le evita, sunt introduse mijloace speciale de sincronizare Cele mai simple dintre acestea sunt semaforele Cu semafoare, problema producător-consumator se rezolvă simplu și elegant UNIX și Windows sunt sisteme de operare complexe Ambele sisteme acceptă paginarea și maparea memoriei fișierelor În plus, acceptă sisteme de fișiere ierarhice, în care fișierele sunt alcătuite dintr-o secvență de octeți În sfârșit, susțin ambele sisteme! procese și fire de execuție a programelor și oferă mecanisme pentru sincronizarea acestora întrebări și sarcini De ce sistemul de operare interpretează doar unele comenzi de nivel , în timp ce firmware-ul interpretează toate comenzile de la nivelul arhitecturii instrucțiunilor? Aparatul are un spațiu de adrese virtuale de de biți adresat de octeți Dimensiunea paginii este de KB Câte pagini de spațiu de adrese virtuale există? Ar trebui ca dimensiunea paginii să fie o putere de doi? Este teoretic posibil să se implementeze o pagină de, să zicem, de octeți? Dacă da, cât de mult este justificată această dimensiune? Memoria virtuală conține pagini virtuale și cadre de pagină fizice Dimensiunea paginii este de de cuvinte Tabelul de pagini corespunzător este prezentat în Tabel Tabelul Tabel de pagini pentru job Pagina virtuală Cadru de pagină unsprezece Nu se află în memoria principală Nu se află în memoria principală Nu în memoria principală Nu în memoria principală ) Creați o listă de adrese virtuale care vor cauza o eroare a paginii atunci când sunt accesate ) Care sunt adresele fizice pentru adresele virtuale , , , , , și ? Computerul are pagini de spațiu de adrese virtuale și doar cadre de pagină Inițial, memoria este goală Programul accesează paginile virtuale în următoarea ordine: , , , , , , , , ) Care dintre apelurile algoritmului LRU va cauza o eroare a paginii? ) Care dintre accesările FIFO va cauza o eroare a paginii? În subsecțiunea „Politica de înlocuire a paginii” a secțiunii „Memorie virtuală”, a fost propus un algoritm de înlocuire a paginii FIFO Dezvoltați un algoritm mai eficient Sugestie: Puteți actualiza contorul în pagina nou încărcată, lăsând toate celelalte neschimbate În sistemele de paginare pe care le discutăm în acest capitol, manipulatorul de erori de paginare a făcut parte din nivelurile arhitecturii instrucțiunilor și, prin urmare, nu este prezent în spațiul de adrese al sistemului de operare În practică, un astfel de handler ocupă unele pagini și poate fi eliminat în anumite circumstanțe (de exemplu, în conformitate cu politica de înlocuire a paginii) Ce s-ar întâmpla dacă gestionarea erorilor nu era disponibilă în momentul în care a apărut eroarea? Cum se rezolvă această problemă? Nu toate computerele conțin un bit hardware special care este setat automat atunci când este scrisă o pagină Cu toate acestea, trebuie să urmăriți cumva ce pagini sunt modificate, astfel încât să nu trebuiască să scrieți toate paginile înapoi pe disc după ce sunt utilizate Dacă presupuneți că fiecare pagină are biți speciali pentru a permite citirea, scrierea și executarea, atunci cum poate urmări modul în care paginile s-au schimbat și care nu s-au schimbat? Memoria segmentată conține segmente de pagină Fiecare adresă virtuală conține un număr de segment de biți, un număr de pagină de biți și un offset de biți AND în cadrul paginii Memoria principală conține KB, care sunt împărțite în pagini de KB Fiecare segment al se decide fie să citească numai, fie să citească și să execute, fie să citească și să scrie, fie să citească, să scrie și să execute Tabelele de pagini și opțiunile de protecție sunt date în Tabel Tabelul Tabelele de pagini pentru job Segmentul Segmentul Segmentul Segmentul Numai citire Citiți și executați Citiți, scrieți și executați Citiți și scrieți Pagina virtuală Cadru de pagină Pagina virtuală Cadru de pagină Pagina virtuală Cadru de pagină Pe disc Nici un tabel de pagini în memoria principală Tabelul de pagini nu este în memoria principală Pe disc Tabelul de pagini nu este în memoria principală Tabelul de pagini nu este în memoria principală Pe disc și inițializarea lor cu valoarea DD redundanță octeți j și inițialându-le la N DD j rezervare octeți ; iar inițializarea lor la Pentru computerele din familia Intel (adică x ), există mai mulți asamblatori care diferă unul de celălalt ca sintaxă În acest capitol, vom folosi limbajul de asamblare Microsoft MASM Există, de asemenea, destul de puține asamblatoare pentru procesoarele ARM, dar sunt apropiate ca sintaxă de asamblatorul x , așa că un exemplu ar trebui să fie suficient Declarațiile de asamblare constau din patru câmpuri: etichete, operații, operanzi și comentarii Etichetele servesc ca nume simbolice pentru adresele de memorie Acestea vă permit să săriți la comenzi și date, permițându-vă să accesați locul în care comenzile și datele sunt stocate printr-un nume simbolic Dacă o declarație este etichetată, eticheta este de obicei plasată la începutul liniei În lista de exemplu, există etichete: FORMULA, I, J și N În asamblatorul MASM, două puncte sunt plasate numai după etichetele instrucțiunilor, dar nu după etichetele datelor Această diferență nu este deloc fundamentală, ci doar că dezvoltatorii diferiților asamblatori au gusturi diferite Arhitectura mașinii nu afectează în niciun fel cutare sau cutare alegere Singurul avantaj al două puncte este că puteți scrie eticheta pe o linie separată și opcode-ul pe următoarea linie, indentată în același mod ca eticheta Fără două puncte, compilatorul nu ar putea distinge eticheta de codul operațional atunci când este plasat pe linii separate La unele asamblatoare, lungimea etichetei este limitată la sau caractere În același timp, în majoritatea limbilor de nivel înalt, lungimea numelor este arbitrară Numele lungi și bine alese fac programul mai ușor de citit și de înțeles Fiecare mașină are mai multe registre, dar au nume complet diferite Registrele Coge I se numesc EAX, EBX, ECX etc Câmpul opcode conține fie o abreviere simbolică a acestui cod (dacă declarația este o reprezentare simbolică a unei instrucțiuni de mașină), fie o directivă de asamblare Alegerea numelui este o chestiune de gust și, prin urmare diferiți dezvoltatori le numesc diferit Dezvoltatorii asamblatorului MASM au decis să folosească notația MOV atât pentru încărcarea unui registru din memorie, cât și pentru salvarea unui registru în memorie Ar putea la fel de bine să folosească MOVE cu LOAD OR STORE Programele în limbaj de asamblare trebuie adesea să rezerve spațiu pentru date Dezvoltatorii MASM au ales numele DD (Define Double) pentru această operațiune deoarece cuvântul avea o lungime de biți Câmpul operanzi al operatorului specifică adresele și registrele care sunt operanzii instrucțiunii mașinii În domeniul operanzilor instrucțiunii de adăugare a întregului, se indică ce trebuie adăugat și la ce Câmpul operand instrucțiunii de salt determină locul în care se face saltul Operanzii pot fi registre, constante, locații de memorie etc În câmpul de comentarii, programatorul își plasează explicațiile cu privire la funcționarea programului Aceste explicații pot fi utile programatorilor care trebuie apoi să utilizeze și să modifice programul altcuiva, precum și autorului însuși al programului când revine să lucreze la el un an mai târziu Un program de asamblare fără astfel de comentarii este ceva complet de neinteligibil (chiar și pentru autorul său) Comentariile pot fi utile doar oamenilor și nu afectează în niciun fel funcționarea programului directive Programul de asamblare definește nu numai instrucțiunile mașinii pe care procesorul trebuie să le execute, ci și instrucțiunile pe care asamblatorul însuși trebuie să le execute (de exemplu, alocă o anumită memorie sau emite o nouă pagină de listare) Comenzile de asamblare sunt numite pseudo-comenzi sau directive de asamblare În Listarea , am văzut deja o pseudo-comandă tipică DD În tabel listează alte pseudo-comenzi (directive) ale asamblatorului MASM pentru platforma x Tabelul Unele directive de asamblare MASM Descrierea directivei SEGMENT Începutul unui nou segment (text, date etc ) cu atribute definite ENDS Încheiați segmentul curent ALIGN Controlează alinierea următoarei comenzi sau date EQU Definiți un nou caracter egal cu expresia dată Alocarea memoriei DB pentru unul sau mai mulți octeți DW Alocarea memoriei pentru unul sau mai multe jumătăți de cuvinte de biți DD Alocarea memoriei pentru unul sau mai multe cuvinte de de biți DQ Alocarea memoriei pentru unul sau mai multe cuvinte duble pe de biți PROC Porniți procedura a continuat £ OOO Capitolul Nivel de asamblare Tabelul (continuare) Descrierea directivei ENDP Încheiați procedura MACRO Pornire macro ENDM End macro PUBLIC Exportați numele definit în acest modul EXTERN Importați numele dintr-un alt modul INCLUDE Apelați un alt fișier și includeți-l în fișierul curent IF Începe asamblarea condiționată a programului pe baza expresiei date ELSE Porniți asamblarea condiționată a programului dacă nu este îndeplinită condiția pentru directiva IF ENDIF Încheiați asamblarea programului condiționat COMMENT Specificarea unui nou caracter de început pentru câmpul de comentariu PAGE Forțați o întrerupere de pagină într-o listă Sfârșit Încheiați programul de asamblare Directiva SEGMENT începe un nou segment, iar directiva ENDS îl încheie Este permis să porniți un segment de text, apoi să începeți un segment de date, apoi să săriți înapoi la un segment de text și așa mai departe Directiva ALIGN transmite următorul șir (de obicei date) la adresa dată de argumentul directivei De exemplu, dacă segmentul curent conține deja de octeți de date, atunci după ce directiva ALIGN este executată, următoarea adresă alocată va fi adresa Directiva EQU dă un nume simbolic unei expresii De exemplu, după următoarea directivă, caracterul BASE poate fi folosit în program în loc de valoarea : BAZĂ EQU Expresia care urmează directivei EQU poate conține mai multe caractere conectate prin aritmetici și alți operatori, de exemplu: LIMIT EQU * BASE + Majoritatea asamblatorilor, inclusiv MASM, necesită ca un simbol să fie definit în program înainte de a apărea într-o expresie ca aceasta Directivele DB, DD, DW și DQ alocă memorie pentru una sau mai multe variabile de , , și, respectiv, octeți De exemplu: TABEL DB , , Această directivă alocă spațiu pentru octeți și le atribuie valori inițiale AND, și respectiv , în plus, definește tabelul de simboluri egal cu adresa unde este stocată valoarea Directivele PROC și ENDP definesc începutul și sfârșitul rutinelor de asamblare Procedurile în limbajul de asamblare îndeplinesc același rol ca și în limbajele de programare de nivel înalt Directivele MACRO și ENDM definesc începutul și sfârșitul unei macrocomenzi Vom vorbi despre macrocomenzi în secțiunea următoare Directivele publice și externe controlează vizibilitatea (accesibilitatea) numelor simbolice Programele sunt adesea scrise ca o colecție de fișiere Uneori, o procedură dintr-un fișier trebuie să apeleze o procedură sau să acceseze date definite într-un alt fișier Pentru a face posibile astfel de referințe încrucișate între fișiere, caracterul (numele) care urmează să fie pus la dispoziția altor fișiere este exportat utilizând directiva PUBLIC Pentru a preveni asamblatorul să dea avertismente cu privire la utilizarea unui simbol care nu este definit în acest fișier, acest simbol poate fi declarat extern (extern), adică definit într-un alt fișier Simbolurile care nu sunt definite în niciuna dintre aceste directive pot fi utilizate numai în cadrul aceluiași fișier Prin urmare, chiar dacă, de exemplu, simbolul F apare în mai multe fișiere, acest lucru nu va provoca niciun conflict, deoarece simbolul specificat este local pentru fiecare fișier Directiva INCLUDE determină asamblatorul să apeleze un alt fișier și să îl includă în cel curent Astfel de fișiere includ adesea definiții, macrocomenzi și alte elemente necesare diferitelor fișiere Multe limbaje de asamblare, inclusiv MASM, acceptă asamblarea condiționată a programelor De exemplu: WORDSIZE EQU IF WORDSIZE GT WSIZE: DD ELSE WSIZE: DD ENDIF Acest program alocă un cuvânt de de biți în memorie și își apelează adresa WSIZE Acest cuvânt primește una dintre valorile: fie , fie , în funcție de valoarea WORDSIZE (în acest caz, ) O astfel de construcție poate fi utilizată într-un program care poate fi asamblat în ambele moduri de de biți și de biți Prin inserarea directivelor IF și ENDIF la începutul și la sfârșitul codului dependent de mașină și apoi prin schimbarea definiției unice, WORDSIZE, programul poate fi ajustat automat la una din două dimensiuni Folosind această abordare, un astfel de program sursă poate fi utilizat pentru mai multe mașini diferite În cele mai multe cazuri, toate definițiile specifice mașinii, cum ar fi WORDSIZE, sunt stocate într-un singur fișier și ar trebui să existe fișiere diferite pentru diferite mașini Prin includerea unui fișier cu definițiile necesare, programul poate fi ușor recompilat pentru diferite mașini Directiva comentariu permite utilizatorului să înlocuiască caracterul de început al comentariului (punct și virgulă) cu altceva Directiva PAGE este folosită pentru a controla listarea unui program În cele din urmă, directiva END marchează sfârșitul programului Există multe mai multe directive în asamblatorul MASM Alți asamblatori x conțin un set diferit de directive, deoarece aceste directive sunt determinate nu de arhitectura mașinii, ci de gusturile dezvoltatorilor de asamblare Macro-uri De obicei, programatorii limbajului de asamblare trebuie să repete aceleași lanțuri de comandă iar și iar Deși este cel mai ușor să scrieți nevoia comenzi ori de câte ori solicită un homosexual, acest lucru devine plictisitor, mai ales dacă secvența este suficient de lungă sau dacă trebuie repetată prea des Desigur, puteți aranja această secvență într-o procedură și o puteți apela dacă este necesar Totuși, această strategie are și dezavantajele ei, deoarece în acest caz va trebui să executați o instrucțiune de apel de procedură specială și o instrucțiune de returnare de fiecare dată Dacă secvențele de instrucțiuni sunt scurte (de exemplu, doar două instrucțiuni), dar sunt utilizate frecvent, atunci apelurile de procedură pot afecta semnificativ performanța programului Macro-urile sunt o soluție simplă și eficientă la această problemă Definiție macro, apel macro și extindere macro O macrocomandă este o modalitate de a da un nume unei bucăți de cod După ce macro-ul este definit, programatorul poate scrie numele macro-ului în loc de un fragment de cod În esență, o macrocomandă este doar numele unei bucăți de cod Lista - arată un program de asamblare x care schimbă de două ori valorile variabilelor P și Q Iată cum arată lanțul principal de instrucțiuni: MOV EAXjP MOV EBXjQ MOV QjEAX MOV PjEBX Lista definește această secvență ca macrocomandă SWAP După ce macro-ul este definit, fiecare apariție a numelui său este înlocuită cu patru linii de cod Lista Modificarea valorilor variabilelor P și Q fără a utiliza macromoѵ EAX,P MOV EBXjQ MOV QjEAX MOV PjEBX MOV EAXjP MOV EBXjQ MOV QjEAX MOV PjEBX Lista - - Modificarea valorilor variabilelor P și Q folosind o macrocomandă SWAP MACRO MOV EAXjP MOV EBXjQ MOV QjEAX MOV PjEBX ENDM SWAP SWAP Deși definiția unei macrocomenzi arată ușor diferită în diferite limbaje de asamblare, în total ea constă din aceleași părți de bază: + antet macro, care dă numele macrocomenzii care se definește; + text care conține corpul macro-ului; + directivă care completează definiția (de exemplu, ENDM) Când asamblatorul întâlnește o definiție de macro într-un program, o stochează în tabelul de definiții de macro pentru o utilizare ulterioară Ori de câte ori o macrocomandă (în exemplul nostru, SWAP) apare ca un cod operațional în program, asamblatorul o va înlocui cu corpul macrocomenzii Utilizarea unui nume de macrocomandă ca opcode se numește apel de macrocomandă, iar înlocuirea acestuia cu un corp de macrocomandă se numește extindere macro Extinderea macro-ului are loc în timpul asamblarii, nu în timpul execuției programului Acest moment este foarte important Programele din listele - și - generează același cod de mașină Este imposibil să se stabilească dintr-un program în limbajul mașinii dacă au fost utilizate macrocomenzi atunci când a fost generat sau nu Nu există semne de macrocomenzi în programul rezultat Apelurile macro nu trebuie confundate cu apelurile de procedură Principala diferență este că un apel macro este o comandă către asamblator pentru a înlocui numele macrocomenzii cu corpul macrocomenzii Un apel de procedură este o instrucțiune de mașină care, odată introdusă într-un program obiect, trebuie executată ulterior pentru a apela procedura În tabel compară apelurile macro și apelurile de procedură Tabelul Compararea apelurilor macro și a apelurilor de procedură Întrebare Apel macro Apel de procedură Când se face apelul? În timpul asamblarii În timpul executării programului Corpul macrocomenzii sau procedurii este inserat în programul obiect de fiecare dată când se efectuează apelul? Nu chiar Este o instrucțiune de apel de procedură inserată într-un program obiect, care este apoi executat? Nu da Trebuie să folosesc comanda return după apel? Nu da Câte copii ale corpului unui apel macro sau proceduri apar într-un program obiect? Unul pentru apel macro Unul La nivel conceptual, putem considera că procesul de asamblare are loc în două treceri La prima trecere, toate definițiile macro sunt păstrate și apelurile macro sunt extinse La a doua trecere, textul rezultat este procesat Cu alte cuvinte, programul original este citit și apoi transformat într-un alt program din care sunt eliminate toate definițiile macro și în care fiecare apel de macro este înlocuit cu un corp de macro Programul rezultat fără macro-uri este apoi trecut la asamblator Este important să rețineți că un program este un șir de caractere, care pot fi litere, cifre, spații, semne de punctuație și simboluri întoarcere cărucior (linie nouă) Extinderea macro-urilor înlocuiește subșirurile specificate din acest șir cu alte șiruri de caractere Macro-urile sunt un mijloc de manipulare a șirurilor de caractere fără a le schimba sensul Macro-uri cu parametri Macro-urile descrise în subsecțiunea anterioară pot fi folosite pentru a reduce volumul programelor care repetă adesea aceeași secvență de comenzi Cu toate acestea, uneori, un program conține mai multe secvențe de comenzi similare, dar nu identice De exemplu, în Lista , prima secvență schimbă valorile P și Q, iar a doua schimbă R și S Lista , Modificarea valorilor a două perechi de variabile fără a utiliza macro-ul MOV EAXjP MOV EBXjQ MOV QjEAX MOV PjEBX MOV EAXjR MOV EBXjS MOV SjEAX MOV RjEBX Pentru a face față unor astfel de secvențe aproape identice, sunt furnizate definiții macro care oferă parametri formali și apeluri macro, în care parametrii formali sunt înlocuiți cu parametri reali Parametrii actuali sunt plasați în câmpul operand al apelului macro Listarea arată programul din Listarea , care include o macrocomandă cu doi parametri Numele simbolice P și P sunt parametri formali În timpul extinderii macro, fiecare apariție a lui P în corpul macro-ului este înlocuită cu primul parametru real și fiecare apariție a lui P cu al doilea parametru real Exemplu: SCHIMBA PjQ În acest apel macro, P este primul parametru real și Q este al doilea parametru real Astfel, programele din listele și sunt identice Lista - - Modificarea valorilor a două perechi de variabile folosind CHANGE MACRO PljP MOV EAX, PI MOV EBXjP MOV P jEAX MOV PljEBX ENDM SCHIMBA PjQ SCHIMBA R,S Caracteristici suplimentare Majoritatea procesoarelor macro acceptă o serie de caracteristici suplimentare care facilitează funcționarea unui programator Aegg Blair În această subsecțiune, ne vom uita la câteva funcții suplimentare ale asamblatorului MASM Pentru toți asamblatorii, o problemă este tipică: etichetele sunt duplicate Să presupunem că macro-ul conține o instrucțiune de ramificare condiționată și un mega la care este făcută ramificația Dacă macro-ul este apelat de două sau mai multe ori, me i va fi duplicat, ceea ce va provoca o eroare Prin urmare, programatorul trebuie ii| scrieți o etichetă pentru fiecare apel ca parametru O altă decizie (este folosită în MASM) este de a declara eticheta locală (LOCAL), când asamblatorul va genera automat o etichetă diferită de fiecare dată când macro-ul este extins În unele asamblatoare, etichetele numerice sunt considerate locale în mod implicit MASM și majoritatea celorlalți asamblatori permit definirea macrocomenzilor în cadrul altor macrocomenzi Această caracteristică este foarte utilă în combinație cu asamblarea dificilă a programului De obicei, aceeași macrocomandă este definită cu i în ambele ramuri ale instrucțiunii IF: Ml MACRO IF WORDSIZE GT M MACRO ENDM ALTE M MACRO ENDM ENDIF ENDM În ambele cazuri, macro M va fi definită, dar definiția depinde dacă programul este asamblat pe o mașină de biți sau pe una de de biți Dacă M nu este apelată, macro M nu va fi definită deloc Unele macrocomenzi pot apela alte macrocomenzi, inclusiv ele însele O macrocomandă E EBX = ROBERTA: MOV ECX, K j ECX = K IMUL EAX, EAX j EAX = I ♦ I IMUL EBX, EBX j EBX = * IMUL ECXj ECX j ECX = K * K MARILYN: ADAUGĂ EAX, EBX > EAX = I * I + * ADAUGĂ EAX, ECX i EAX \u d I ♦ I + * n i- K * K STEPHANY: JMP DONE, trec la DONE La prima trecere, majoritatea asamblatorilor folosesc cel puțin trei tabele: tabelul de simboluri, tabelul de directive și tabelul de coduri operaționale Dacă este necesar, se folosește și un tabel literal Tabelul cu nume simbolice conține o intrare pentru fiecare nume, așa cum se arată în Tabelul Numele simbolice sunt fie etichete, fie definite în mod explicit (de exemplu, folosind directiva EQU) Fiecare element al tabelului de nume simbolice conține numele în sine (sau un indicator către oo capitolul nivel de asamblare it), valoarea sa numerică și uneori unele informații suplimentare Poate include: + lungimea câmpului de date asociat cu numele simbolic; + biți de realocare a memoriei (care indică dacă valoarea simbolului se va schimba dacă programul este încărcat ns la adresa unde ar fi trebuit să fie încărcat de către asamblator); + informații despre dacă numele simbolic poate fi accesat din afara procedurii Tabelul Tabel de simboluri pentru programul din lista Nume simbolic Semnificație Alte informații MARIA ROBERTA MARILYN STEFANIA Tabelul de coduri operaționale are cel puțin o intrare pentru fiecare cod operațional de asamblare simbolică (Tabelul ) Fiecare intrare conține un cod operațional de caractere, doi operanzi, o valoare numerică a codului operațional, lungimea instrucțiunii și un număr de tip prin care puteți determina cărui grup îi aparține codul operațional (codurile operaționale sunt împărțite în grupuri în funcție de numărul și tipul operanzilor) Tabelul Mai multe elemente ale tabelului de opcode asamblatorului x Opcode Primul operand Al doilea operand Cod hexadecimal Lungime comandă Clasa de comandă AAA — — ADAUGĂ EAX immcd ADĂUGAȚI regul SI EAX immed ȘI regul Ca exemplu, luați în considerare opcode-ul ADD Dacă primul operand al instrucțiunii ADD este registrul EAX și al doilea operand este o constantă de de biți (immed ), atunci se folosește codul operațional x și lungimea instrucțiunii este de octeți (pentru constantele care pot fi exprimate în și biți, se folosesc alte coduri decât cele indicate în tabel) Dacă ambii operanzi ai unei instrucțiuni ADD sunt registre, instrucțiunea are octeți și codul operațional este x Toate combinațiile de opcode și operanzi care se potrivesc cu această regulă sunt clasa și sunt tratate la fel ca o instrucțiune ADD cu două registre ca operanzi O clasă de comandă identifică o procedură care este apelată pentru a procesa toate comenzile de un anumit tip În unele asamblatoare, este posibil să scrieți instrucțiuni folosind adresarea directă, chiar dacă instrucțiunea corespunzătoare nu este în limba țintă Astfel de comenzi cu adrese „pseudo-directe” sunt procesate în felul următor Asamblatorul atribuie o zonă de memorie operandului imediat la sfârșitul programului și generează o instrucțiune care îl accesează De exemplu, mainframe-ul IBM nu are comenzi cu adrese directe Cu toate acestea, pentru a încărca constanta cu cuvânt complet în registrul , programatorul poate scrie comanda: L =F' ' Astfel, programatorul nu trebuie să scrie o directivă pentru a plasa un cuvânt în memorie, să-i dea valoarea , să-i dea o etichetă și apoi să folosească acea etichetă într-o instrucțiune L Constanțele pentru care asamblatorul le alocă automat memorie sunt numite literale Literale fac programul mai ușor de citit și de înțeles; cu ele, semnificația constantei devine evidentă deja atunci când citiți în enunțul original La prima trecere, asamblatorul construiește toate literalele care sunt utilizate în program Toate cele trei computere pe care le-am luat drept exemple au instrucțiuni cu adrese imediate, astfel încât asamblorii lor nu acceptă literale Comenzile cu adrese imediate sunt acum considerate destul de comune, deși înainte erau considerate ceva complet exotic Poate că popularitatea literalilor i-a convins pe dezvoltatori că adresarea directă este o idee foarte bună Dacă sunt necesare literali, atunci în timpul asamblarii este stocat un tabel de literali în care apare un nou element de fiecare dată când este întâlnit un literal După prima trecere, tabelul este sortat și elementele duplicat sunt eliminate Lista arată o procedură care poate sta la baza primei treceri a asamblatorului Numele comenzilor sunt alese în așa fel încât esența lor să fie clară Această listă este un bun punct de plecare pentru învățarea adunării Este destul de scurt, de înțeles și arată care ar trebui să fie următorul pas - aceasta este scrierea procedurilor care sunt menționate în această listă Lista Prima trecere a asamblatorului simplu public static void pass one() { // Diagrama primei treceri a asamblatorului boolean more input=true; Linie șir, simbol, literal, int locație counter, lungime, int final ENDSTATEMENT = - ; locație counter = ; initialize tables(); în timp ce (mai multe input) { line = read next line(); lungime = ; tip= ; // steag care oprește prima trecere opcode; // câmpuri de comandă valoare, tip; // variabile // sfârșitul semnalelor de intrare // asamblarea primei instrucțiuni în celula // inițializare generală // more input cu directiva END // primește valoarea „false” // citește șirul // # octet în comandă // tipul comenzii if (linia nu este comentare(linia)) { simbol = verifica pentru simbol(linie); dacă (simbol != nul) // șirul conține o etichetă? // dacă da, atunci // caracterul și valoarea sunt scrise continuare & Lista - (continuare) enter new symbol(simbol, locație counter); literal = check for literal(line); // șirul conține un literal? if (literal != nulli) // dacă da, atunci it // stocat în tabel enter new literal(literal); // Acum definim tipul de opcode - înseamnă opcode invalid opcode = extract opcode(line); // determină locația codului de operare tip=search opcode table(opcode); // găsiți formatul, II, de exemplu, OP REG ,REG if (type Modulul obiect B Modulul obiect A Orez Programul executabil din fig , b, deplasat în sus cu de adrese Multe comenzi accesează acum adresele de memorie greșite Chiar dacă aceste informații ar fi disponibile, ar fi o risipă să redistribuim toate adresele de fiecare dată când programul este încărcat Problema mutarii programelor deja legate si stocate in memorie este direct legata de momentul in care numele simbolice sunt in sfarsit legate de adresele de memorie fizica absolute Programul conține nume simbolice pentru adresele de memorie (de exemplu, BR L) Momentul la care este determinată adresa din memoria principală corespunzătoare numelui L se numește timp de legare Există cel puțin șase timpi de legare: Când se scrie programul Când programul este difuzat Când programul se conectează, dar înainte de încărcare Când programul este încărcat Când este încărcat registrul de bază, care este folosit pentru adresare Când se execută o comandă care conține adresa necesară Dacă o instrucțiune care conține o adresă este remapată în memorie după ce a fost legată, acea adresă este invalidă (presupunând că obiectul referit este, de asemenea, mutat în memorie) Dacă compilatorul generează cod binar executabil, atunci legătura are loc în timpul traducerii, iar programul trebuie rulat de la adresa specificată de torul trappel Folosind metoda descrisă în subsecțiunea anterioară, numele simbolice sunt asociate cu adrese absolute în timpul conectării, motiv pentru care programele nu pot fi mutate după legare (vezi Figura ) Sunt două întrebări aici În primul rând, când sunt asociate numele simbolice cu adrese virtuale? În al doilea rând, când sunt asociate adresele virtuale cu adresele fizice? Numai după aceste două operații procesul de legare poate fi considerat finalizat Când linker-ul îmbină spații de adrese separate ale modulelor obiect într-un singur spațiu de adrese liniar, acesta creează de fapt un spațiu de adrese virtual Realocarea și legarea memoriei sunt necesare pentru a asocia nume simbolice cu adrese virtuale specifice Acest lucru este valabil indiferent dacă se utilizează sau nu memoria virtuală Să presupunem că spațiul de adrese prezentat în Fig , b, a fost paginat Este clar că adresele virtuale corespunzătoare numelor simbolice A, B, C și D sunt deja definite, deși adresele lor fizice vor depinde de conținutul tabelului de pagini În realitate, legarea numelor simbolice de adrese virtuale are loc în codul binar executabil Orice mecanism care face ușoară schimbarea mapării adreselor virtuale cu adresele din memoria fizică principală va facilita mutarea unui program în memoria principală, chiar dacă acestea sunt deja asociate cu un spațiu de adrese virtuale Un astfel de mecanism este paginarea Dacă un program este mutat în memoria principală, trebuie schimbat doar tabelul de pagini, nu programul în sine Cel de-al doilea mecanism este utilizarea Registrului de remapare și completare a timpului Calculatorul CDC și succesorii săi conțineau un astfel de registru Pe mașinile care utilizează această tehnică de remapare a memoriei, registrul indică întotdeauna adresa fizică a începutului programului curent În hardware, acest registru este adăugat la toate adresele înainte ca acestea să fie alocate în memorie Întregul proces de realocare a memoriei este transparent pentru programele utilizatorului I Programele utilizatorului nici măcar nu știu că memoria este realocată Dacă programul este mutat, sistemul de operare trebuie să |>actualizeze registrul de realocare Acest mecanism este mai puțin comun decât paginarea, deoarece întregul program trebuie mutat (dacă există registre separate de realocare pentru cod și date, ca, de exemplu, în procesorul Intel , atunci ambele părți ale programului vor fi obiecte mutate) Al treilea mecanism poate fi utilizat în mașinile care implementează capacitatea de a accesa memorie în raport cu contorul de programe La aceste mașini, ori de câte ori un program este mutat în memoria principală, este suficient să actualizați doar contorul de programe Un program, ale cărui accesuri la memorie sunt fie asociate cu contorul de programe, fie sunt absolute (de exemplu, accesări la registrele dispozitivelor I/O prin adrese absolute), se numește independent de poziție I O procedură independentă de apel poate fi plasată oriunde în spațiul de adrese virtuale fără a fi necesară realocarea adreselor de memorie Legătura dinamică Strategia de legare despre care am discutat în subsecțiunea Sarcini de legătură are o caracteristică: toate procedurile cerute de program sunt legate înainte de începerea programului Cu toate acestea, dacă toate legăturile sunt stabilite înainte ca programul să înceapă să ruleze într-un computer cu memorie virtuală, posibilitățile memoriei virtuale nu vor fi utilizate pe deplin Multe programe conțin proceduri care sunt apelate numai în anumite circumstanțe De exemplu, compilatoarele conțin proceduri pentru compilarea declarațiilor rar utilizate sau pentru remedierea erorilor rare O modalitate mai flexibilă de a lega procedurile compilate separat este de a lega fiecare procedură în momentul în care este apelată pentru prima dată Acest proces se numește legătură dinamică Legătura dinamică a fost folosită pentru prima dată în sistemul MULTICS și, în unele privințe, această implementare rămâne de neegalat Să ne uităm la exemple de legături dinamice pe mai multe sisteme Legături dinamice în MULTICS În sistemul MULTICS, fiecare program este asociat cu un segment, așa-numitul segment de legătură Conține un bloc de informații pentru fiecare procedură care poate fi apelată Acest bloc începe cu un cuvânt rezervat pentru adresa virtuală a procedurii, urmat de numele procedurii, care este stocat ca șir de caractere În legarea dinamică, apelurile de procedură în limba gazdă sunt traduse în instrucțiuni care, prin adresare indirectă, se referă la primul cuvânt al blocului corespunzător, așa cum se arată în Fig , a Compilatorul completează acest cuvânt fie cu o adresă invalidă, fie cu un set special de biți care aruncă o excepție Segmentul de procedură A Apelați Pământul CHEAM FOC Apelați ATR CHEAM APA Apelați Pământul CHEAM APA Segment de aspect Adresă greșită aplicatie' R Adresă greșită Adresă greșită E R A R E Adresă greșită Cuvânt nevalid Informații de aspect pentru procedura AIR Numele procedurii este stocat ca șir de caractere b Orez Legătura dinamică: procedură EARTH înainte de apel (a); procedura EARTH după apelarea și conectarea {b) Când apelați o procedură într-un alt segment, o încercare de a accesa indirect un cuvânt nevalid aruncă o excepție de linker Linkerul găsește apoi șirul de caractere din cuvântul care urmează adresei greșite și începe să caute în directorul utilizatorului procedura compilată cu numele găsit În continuare, acestei proceduri i se alocă o adresă virtuală (de obicei în propriul segment), iar această adresă virtuală este scrisă peste adresa greșită, așa cum se arată în fig b Comanda care a provocat eroarea de legătură este apoi re-execută, permițând programului să continue unde era înainte de excepție Toate apelurile ulterioare la această procedură vor rula fără eroare, deoarece cuvântul anterior nevalid conține acum adresa virtuală corectă Prin urmare, cu legătura dinamică, linkerul este apelat numai atunci când procedura este apelată pentru prima dată Nu trebuie să-l suni din nou Legături dinamice în Windows Toate versiunile de Windows, inclusiv Windows NT, acceptă legătura dinamică Legătura dinamică utilizează un format de fișier special numit DLL (Dynamic Link Library) Bibliotecile de legături dinamice pot conține proceduri, date sau ambele De obicei, acestea sunt utilizate pentru a permite două sau mai multe procese să partajeze procedurile și datele unei biblioteci Majoritatea fișierelor DLL au extensia dll, dar există și alte extensii, cum ar fi drv (pentru bibliotecile de drivere) și fon (pentru bibliotecile de fonturi) Cea mai comună formă de DLL este o bibliotecă, care constă dintr-un set de proceduri care pot fi încărcate în memorie și accesate de mai multe procese în același timp Pe fig Figura prezintă două procese care partajează un fișier DLL care conține proceduri, L, B, C și D Programul utilizează procedura L; programul este procedura C, deși ar putea foarte bine să folosească aceeași procedură utilizator Personalizat procesul procesul Orez Două procese au același DLL Fișierul DLL este construit de linker dintr-un set de fișiere de intrare Construirea unui DDL este similară cu construirea unui binar executabil, cu excepția faptului că, atunci când DLL-ul este construit, un steag special este transmis linkerului pentru a indica faptul că DLL-ul este necesar Fișierele DLL sunt de obicei asamblate dintr-un set de rutine de bibliotecă care pot fi necesare proceselor multiple Exemple comune de DLL-uri sunt interfețele pentru biblioteca de apeluri de sistem Windows și bibliotecile grafice mari Folosind fișiere DDL, economisim spațiu în memorie și pe disc Dacă o anumită bibliotecă ar fi legată static la fiecare program care o folosește, acea bibliotecă ar trebui inclusă în toate binarele executabile din memorie și pe disc, ceea ce ar fi prea irositor Și dacă există un fișier DLL, va exista o singură instanță a bibliotecii pe disc și în memorie În plus, această abordare facilitează actualizarea rutinelor bibliotecii, chiar și după ce programele care le folosesc au fost compilate și legate Pentru pachetele software comerciale în care programul de intrare nu este în mod normal disponibil pentru utilizatori, prezența fișierelor DLL înseamnă că furnizorul de software va putea remedia erorile software detectate prin simpla distribuire de noi fișiere DLL pe Internet, fără a necesita modificări ale fișierelor binare a principalelor programe Principala diferență dintre un DLL și un program binar executabil este că un fișier DLL nu poate rula și rula singur (deoarece nu are un program principal) De asemenea, conține informații complet diferite în antet În plus, fișierul DLL are mai multe proceduri suplimentare care nu au legătură cu procedurile din bibliotecă De exemplu, există o procedură care este apelată automat ori de câte ori un proces nou se conectează la un fișier DLL și o altă procedură care este apelată automat ori de câte ori un proces se leagă la un fișier DLL Aceste rutine pot aloca și dezaloca memorie sau gestiona alte resurse de care DLL-ul are nevoie Un program se poate conecta la un fișier DLL în două moduri: prin legare implicită sau explicită Cu legături implicite, programul utilizatorului este legat static la un fișier special, așa-numita bibliotecă de import O bibliotecă de import este creată de un utilitar special conceput pentru a extrage anumite informații dintr-un fișier DLL Biblioteca de import oferă o legătură prin care programul utilizatorului poate accesa fișierul DLL Un program utilizator poate fi conectat la mai multe biblioteci de import Când un program care este legat implicit este încărcat în memorie pentru execuție, Windows verifică ce DLL-uri are nevoie și dacă acestea sunt toate în memorie Acele fișiere care nu sunt încă în memorie sunt încărcate acolo imediat (dar nu neapărat în întregime, deoarece sunt paginate) Apoi, anumite modificări sunt aduse structurilor de date din bibliotecile de import, astfel încât să poată fi determinată locația procedurilor apelate (aceasta este similară* cu modificările ilustrate în Figura ) De asemenea, ele trebuie mapate la spațiul de adrese virtuale al programului Din acest moment, programul utilizatorului este gata de rulare; poate apela proceduri din fișierele DLL ca și cum ar fi legate static la el Alternativa este legarea explicită Legătura explicită nu necesită nici biblioteci de import sau încărcare concomitentă a DLL-urilor de la utilizator ■ lava city jpuDQHD ayivmilvri program În schimb, programul utilizator efectuează un apel explicit în timpul execuției pentru a se conecta la fișierul DLL și apoi face apeluri suplimentare pentru a obține adresele procedurilor de care are nevoie Când toate acestea sunt făcute, programul face un apel final pentru a rupe legătura cu fișierul DLL Când ultimul proces întrerupe legătura cu un fișier DLL, acel fișier poate fi descărcat din memorie Este important să înțelegeți că o procedură dintr-un fișier DLL nu are caracteristici distinctive (cum ar fi procese sau fire de execuție) Se rulează pe firul programului apelant și folosește stiva programului apelant pentru variabilele locale Poate conține date statice specifice procesului (precum și date generale), dar altfel funcționează ca o procedură legată static Singura diferență semnificativă este modul în care este stabilită conexiunea Legături dinamice în UNIX UNIX utilizează biblioteci partajate care sunt în esență similare cu DLL-urile Windows La fel ca un fișier DLL, o bibliotecă de acces partajat este un fișier de arhivă care conține mai multe proceduri sau module de date care sunt prezente în memorie în timp ce un program rulează și poate fi asociat cu mai multe procese în același timp Biblioteca standard C și majoritatea programelor de rețea sunt biblioteci partajate UNIX acceptă numai legături implicite, astfel încât biblioteca de acces partajat constă din două părți: o bibliotecă gazdă (binara gazdă), care este legată static la executabil și o bibliotecă țintă (binara țintă), care este apelată în timpul execuției În ciuda unor diferențe în detaliu, conceptul este în esență același cu conceptul DLL Rezumatul capitolului Deși majoritatea programelor pot și ar trebui să fie scrise în limbaje de nivel înalt, în unele situații este necesară utilizarea limbajului de asamblare Candidații probabili sunt programe pentru calculatoare cu resurse insuficiente (de exemplu, procesoare pentru carduri inteligente, diverse dispozitive, dispozitive digitale portabile) Un program de asamblare este o reprezentare simbolică a unui program într-un anumit limbaj de mașină Este tradus în limbajul mașinii printr-un program special numit assembler Dacă o aplicație necesită performanțe ridicate, cel mai bine este să scrieți mai întâi programul într-un limbaj de nivel înalt, apoi prin teste pentru a determina care parte a programului durează cel mai mult timp pentru a fi executată și să rescrieți numai aceste părți ale programului în asamblator Practica arată că adesea o mică parte din întregul program ocupă cea mai mare parte a întregului timp de execuție al acestui program Mulți asamblatori oferă macrocomenzi care permit programatorilor să dea nume simbolice secvențe întregi de instrucțiuni De obicei, aceste macrocomenzi pot fi parametrizate Macro-urile sunt implementate folosind un algoritm de procesare literală a șirului Majoritatea asamblatorilor sunt cu două treceri În timpul primei treceri, este construit un tabel de nume simbolice pentru etichete, literale și identificatori declarați Numele simbolice pot fi fie nesortate și căutate prin scanări secvențiale de tabel, fie mai întâi sortate și apoi căutate în binar sau împărțite Dacă numele simbolice nu trebuie să fie eliminate în timpul primei treceri, hashing este cea mai bună metodă Programul executabil este creat în timpul celei de-a doua treceri În ceea ce privește directivele (pseudo-comenzi), unele dintre ele sunt executate în timpul primei treceri, altele - în timpul celei de-a doua Programele care se asamblează independent unele de altele pot fi legate între ele pentru a forma un program binar executabil Această activitate este realizată de linker, care remapează programele în memorie și leagă nume Legătura dinamică este o tehnică în care anumite proceduri nu sunt legate până când sunt apelate Bibliotecile partajate pe UNIX și bibliotecile cu linkuri dinamice (DLL) pe Windows folosesc tehnologia linkurilor dinamice Întrebări și sarcini În unele programe, doar % din cod durează % din timpul de execuție Comparați următoarele trei strategii în ceea ce privește programarea și timpul de execuție Să presupunem că este nevoie de de luni-om pentru a scrie un program C, dar assemblerul este de ori mai greu de scris, dar de ori mai eficient ) Întregul program este scris în C ) Întregul program este scris în assembler ) Programul este mai întâi scris în C, iar apoi % necesar din program este rescris în assembler Regulile asamblatorilor cu două treceri sunt aplicabile compilatorilor? Luați în considerare următoarele situații ipotetice ) Compilatorul generează module obiect în loc de codul de asamblare ) Compilatorul generează limbaj de asamblare simbolic Toți asamblatorii pentru platforma x primesc adresa țintă ca prim operand și adresa sursă ca al doilea Ce probleme ar putea apărea cu o abordare diferită? Următorul program poate fi asamblat în două treceri? EQU este o directivă care echivalează o etichetă cu o expresie dintr-un câmp operand P EQU QQ EQU RR EQU SS EQU O anumită companie plănuiește să dezvolte un asamblator pentru un computer cu un cuvânt de de ori Pentru a reduce costurile, managerul de proiect a decis să o facă Reduceți lungimea numelor simbolice, astfel încât fiecare nume să poată fi stocat într-un singur cuvânt Managerul a anunțat că numele simbolice pot consta doar din litere, cu litera Q interzisă Care este lungimea maximă a unui nume simbolic? Descrieți schema dvs de codare Care este diferența dintre o comandă și o directivă? Cum este diferit contorul de adrese de comandă de contorul de comenzi? Există vreo diferență între ele? La urma urmei, ambii țin evidența informațiilor despre următoarea comandă din program Care va fi tabelul numelor simbolice după procesarea următoarelor instrucțiuni de asamblare x (primei instrucțiuni i se atribuie adresa )? EVEREST: K : POP IN PUSH BP ; ( octet); ( octet) WHITNEY: MOV BP,SP ; ( octeți) MCKINLEY: PUSH X ; ( octeți) FUJI: PUSH SI ; ( octet) QIBO: SUB SI, ; ( octeți) Vă puteți imagina circumstanțe în care o etichetă s-ar potrivi cu un cod operațional (de exemplu, comenzile mele ar putea fi folosite ca etichetă)? Argument Ce pași trebuie făcuți pentru a găsi elementul „Berkeyey” prin căutare binară în următoarea listă: Ann Arbor, Berkeley, Cambridge, Eugene, Madison, New Haven, Palo Alto, Pasadena, Santa Cruz, Stony Brook, Westwood, Izvoarele Galbene Când calculați elementul din mijloc într-o listă cu un număr par de elemente, luați elementul care vine imediat după cel din mijloc I Este posibil să se utilizeze o căutare binară pe un tabel care conține un număr prim de elemente? Calculați codul hash pentru fiecare dintre următoarele nume simbolice Pentru a face acest lucru, adunați literele (a = , b = etc ) și luați rezultatul modulo dimensiunea tabelului hash Tabelul hash conține sloturi (de la la ) els, jan, jelle, maaike Fiecare nume simbolic oferă o valoare hash unică? Dacă nu, cum se rezolvă coliziunea? Metoda hash descrisă în textul capitolului vă permite să aranjați toate elementele care au același cod hash într-o listă legată O metodă alternativă este crearea unui singur tabel de n sloturi, cu spațiu în fiecare slot pentru o cheie și valoarea acesteia (sau pointeri către acestea) Dacă algoritmul de hashing generează un slot care este deja plin, se face o a doua încercare folosind același algoritm de hashing Dacă de data aceasta slotul este plin, algoritmul este aplicat din nou și așa mai departe Aceasta continuă până când este găsit un slot gol Dacă proporția de sloturi care sunt deja umplute este R, atunci de câte încercări vor fi necesare în medie pentru a introduce un nou caracter în tabel? Probabil, cândva în viitor, va fi posibil să puneți mii de procesoare identice pe un singur cip, fiecare dintre ele conține întrebări și sarcini ooh câteva cuvinte de memorie locală Dacă toate procesoarele pot citi și scrie trei registre comune, atunci cum se implementează memoria asociativă? Procesorul x are o arhitectură segmentată cu mai multe segmente independente Asamblatorul pentru această mașină ar putea conține o directivă SEG N care pune codul și datele ulterioare în segmentul N Ar afecta o astfel de schemă contorul de adrese de instrucțiuni? Programele sunt adesea legate de numeroase DLL-uri Nu ar fi mai eficient să puneți toate procedurile într-un fișier DLL mare și apoi să îl conectați? Este posibil să mapați un fișier DLL la spațiile de adrese virtuale ale două procese cu adrese virtuale diferite? Dacă da, care sunt problemele? Pot fi rezolvate? Dacă nu, ce se poate face pentru a le elimina? O modalitate de conectare (statică) este următoarea: înainte de a scana biblioteca, linkerul face o listă de proceduri necesare, adică nume care sunt definite ca externe (externe) în modulele legate Linker-ul apoi iterează prin întreaga bibliotecă în secvență, extragând fiecare procedură care se află în lista* de nume dorite Va funcționa o astfel de schemă? Dacă nu, de ce nu și cum se poate remedia? Poate fi folosit un registru ca parametru real într-un apel macro? Dar o constantă? Dacă da, de ce? Dacă nu, de ce nu? Trebuie să implementați un macro-asamblator Din motive estetice, șeful tău a decis că definițiile macro nu ar trebui să precedă apelurile macro Cum va afecta această decizie implementarea? Gândiți-vă cum puteți introduce macro-asamblatorul într-o buclă infinită Linkerul citește module de , , , și respectiv de cuvinte Dacă sunt încărcate în această ordine, atunci care sunt constantele de realocare a memoriei? Scrieți un modul de tabel de simboluri format din două proceduri: introducere (simbol, valoare) și căutare (simbol, valoare) Primul introduce noi nume simbolice în tabel, iar al doilea le caută în tabel Utilizați o opțiune de hashing Repetă exercițiul anterior, dar în loc de un tabel hash, după ce ai introdus numele de familie, sortează tabelul și folosește algoritmul de căutare binar pentru a găsi numele simbolice Scrieți asamblatorul simplu pentru computerul Mic- despre care am discutat în capitolul Pe lângă operarea pe instrucțiunile mașinii, oferiți capacitatea de a atribui constante numelor simbolice în timpul asamblarii, precum și capacitatea de a asambla o constantă într-o cuvânt mașină Adăugați macrocomenzi la asamblatorul pe care ar fi trebuit să-l scrieți în sarcina anterioară Capitolul Arhitecturi de computere paralele Viteza computerelor este din ce în ce mai rapidă, dar cerințele impuse acestora sunt în continuă creștere Astronomii încearcă să modeleze întreaga istorie a universului de la Big Bang până în zilele noastre Farmacistii ar dori sa dezvolte noi medicamente folosind computere fara a sacrifica legiuni de sobolani de laborator Proiectanții de aeronave ar putea obține rezultate mai bune dacă, în loc să construiască tuneluri de vânt uriașe, și-ar modela proiectele pe un computer Pe scurt, oricât de puternice sunt computerele, capacitățile lor nu vor fi niciodată suficiente pentru a rezolva multe probleme nebanale (în special științifice, tehnice și industriale) Deși frecvența ceasului crește constant, performanța bazei elementului nu poate fi crescută la nesfârșit Principala problemă rămâne viteza luminii - este imposibil să faci protonii și electronii să se miște mai repede Datorită transferului ridicat de căldură, computerele s-au transformat în aparate de aer condiționat de înaltă tehnologie În cele din urmă, pe măsură ce tranzistoarele devin tot mai mici, în cele din urmă va veni un moment în care fiecare tranzistor va fi format din mai mulți atomi, astfel încât legile mecanicii cuantice (cum ar fi principiul incertitudinii lui Heisenberg) pot deveni o problemă majoră Drept urmare, pentru a putea rezolva probleme mai complexe, dezvoltatorii au apelat la calculatoare paralele (denumite în continuare computere paralele) Este imposibil să construiești un computer cu un procesor și un timp de ciclu de , ns, dar este posibil să construiești un computer cu de procesoare, fiecare cu un timp de ciclu de ns Și deși viteza fiecărui procesor în al doilea caz este evident scăzută, teoretic ar trebui să obținem performanța necesară Paralelismul poate fi introdus la diferite niveluri La cel mai de jos nivel, poate fi implementat într-un procesor prin pipelining și o arhitectură superscalară cu mai multe blocuri funcționale Paralelismul ascuns poate fi realizat prin prelungirea semnificativă a cuvintelor din comenzi Prin funcții suplimentare, puteți „învăța” procesorul să proceseze mai multe fire de execuție de program în același timp În cele din urmă, puteți instala mai multe procesoare pe același cip Cu toate acestea, toate aceste tehnici luate împreună pot îmbunătăți performanța de maximum ori în comparație cu soluțiile secvenţiale clasice La nivelul următor, este posibil să se introducă în sistem plăci CPU externe cu capacități de calcul îmbunătățite De obicei, procesoarele plug-in implementează funcții speciale, cum ar fi procesarea pachetelor de rețea, procesarea media, criptografia etc Performanța aplicațiilor specializate datorită acestor funcții poate fi mărită de K) ori Pentru a îmbunătăți performanța cu un factor de o sută, o mie sau un milion, mai multe procesoare trebuie reunite și interacționate eficient Acest principiu este implementat sub forma unor sisteme mari multiprocesoare și multicalculatoare (calculatoare cluster) Desigur, combinarea a mii de procesoare într-un singur sistem creează noi probleme care trebuie rezolvate În cele din urmă, recent a devenit posibilă integrarea unor organizații întregi prin intermediul internetului Ca rezultat, se formează rețele de calcul distribuite slab conectate, sau matrice (grile) Astfel de sisteme abia încep să se dezvolte, dar potențialul lor este foarte mare Atunci când două procesoare sau elemente de procesare sunt la rând și fac schimb de cantități mari de date cu întârzieri reduse, ele sunt numite strâns cuplate În consecință, atunci când zilele procesorului sau ale elementelor de procesare sunt situate departe unele de altele și fac schimb de cantități mici de date cu întârzieri mari, erorile se numesc cuplate vag În acest capitol vom discuta principii pentru dezvoltarea sistemelor acestor forme de paralelism și luați în considerare o serie de exemple Începând cu sistemele puternic cuplate, care se caracterizează prin paralelism pe cip, vom trece treptat la sistemele slab cuplate! iar în partea finală a capitolului vom vorbi despre sistemele de calcul distribuite O gamă aproximativă de subiecte luate în considerare este ilustrată în Fig Sisteme puternic cuplate Sisteme slab cuplate "a B C D E Orez Paralelismul intraprocesor (a); coprocesor (b); multiprocesor (» multicomputer (r); sistem de calcul distribuit slab cuplat (e) Paralelismul este în mod constant un subiect de discuții aprinse, iar în legătură cu acest capitol există neobișnuit de multe referințe - în principal la lucrări recente pe această temă Referințe suplimentare la lucrări cu caracter introductiv pot fi găsite în secțiunea relevantă a capitolului paralelism intraprocesor O modalitate evidentă de a crește performanța unui cip este de a-l face să efectueze mai multe operațiuni pe unitatea de timp În această secțiune, vom analiza câteva dintre tehnicile de îmbunătățire a vitezei de paralelism pe cip, cum ar fi paralelismul la nivel de instrucțiuni, multithreading și procesoare multiple pe un cip Toate aceste metode, deși diferite unele de altele, într-o măsură sau alta ajută la rezolvarea problemei Ele sunt legate de principiul de bază – „comprimarea” operațiilor în timp Paralelism la nivel de instruire Paralelismul de nivel scăzut se realizează, în special, prin apelarea mai multor instrucțiuni într-un ciclu de ceas Procesoarele care implementează acest principiu se împart în două categorii: superscalare și VLIW Ambele au fost deja menționate în capitolele anterioare, dar acum este util să repetam acest material Schema procesorului superscalar este prezentată în fig În cele mai comune configurații, o instrucțiune trebuie să fie gata pentru execuție la un anumit punct al conductei Procesoarele superscalare sunt capabile să apeleze mai multe instrucțiuni într-un singur ciclu de ceas Numărul de instrucțiuni efectiv apelate depinde atât de designul procesorului, cât și de situația actuală Limitările hardware dictează numărul maxim de comenzi care pot fi apelate în același timp - de obicei de la două la șase În plus, dacă o instrucțiune necesită un bloc funcțional indisponibil sau rezultatul unei alte instrucțiuni care nu a fost încă primită, o astfel de instrucțiune nu va fi apelată chiar dacă este posibil fizic Un alt tip de paralelism la nivel de instrucțiune este implementat în procesoarele cu un cuvânt de instrucțiune foarte lung (Ver Long Instruction Word, VLIW) În implementarea lor originală, sistemele VLIW prezentau într-adevăr cuvinte lungi cu instrucțiuni care accesau mai multe blocuri funcționale De exemplu, luați în considerare transportorul prezentat în Fig , a Include cinci blocuri funcționale și este capabil să execute simultan două operații întregi, o operație în virgulă mobilă, o instrucțiune de încărcare și o instrucțiune de salvare O instrucțiune a acestui sistem VLIW conține cinci opcode și cinci perechi de operanzi - un cod și o pereche pentru fiecare bloc funcțional Ținând cont de faptul că codul de operare are biți, registrul - biți, iar celula de memorie - de biți, lungimea totală a comenzii poate ajunge la de biți, ceea ce, vedeți, este mult Cu toate acestea, această decizie a fost considerată nereușită Cert este că nu toate comenzile au putut accesa blocurile funcționale corespunzătoare, ca urmare, operațiunile goale fără sens au apărut din abundență (Fig , b) În sistemele moderne VLIW, ar trebui furnizat un mecanism pentru marcarea pachetelor de comenzi, de exemplu, bitul „terminare a pachetului” poate fi utilizat pentru aceasta (Fig , c) Procesorul poate selecta și rula întregul pachet Sarcina de a pregăti pachete de comenzi care pot fi executate împreună este rezolvată de compilator Operare gol Comanda VLIW Marcator de sfârșit de legare Pachet în Orez Conducta procesorului (a); secvența de comenzi VLIW ( ); flux de comandă cu pachete marcate (c) De fapt, în sistemele VLIW, soluția la problema compatibilității instrucțiunilor este transferată din timpul de execuție în etapa de compilare Ca rezultat, hardware-ul este simplificat și mai ieftin De asemenea, deoarece nu există limite de timp dificile în operarea compilatorului*, lanțurile de comandă sunt formate mai semnificativ decât dacă s-ar întâmpla în timpul execuției Din păcate, este foarte greu de pus în practică o astfel de transformare radicală a arhitecturii procesorului, ceea ce este confirmat de răspândirea mai mult decât moderată a procesorului Itanium Este demn de remarcat faptul că paralelismul la nivel de instrucție nu este singura formă posibilă de paralelism de nivel scăzut Există și paralelism la nivelul memoriei, care presupune executarea simultană a mai multor operații în memorie [Chou et al , ] ilava despre arhitecturi paralele de calculatoare Procesor TriMedia VLIW În capitolul , folosind procesorul Itanium ca exemplu, am întâlnit deja arhitectura VLIW Acum haideți să facem cunoștință cu un alt procesor VLIW - TriMedia produs de Philips TriMedia este un procesor încorporat pentru imagini, dispozitive audio și video precum playere CD, DVD și MP , recordere CD și DVD, televizoare interactive, camere digitale, camere video etc Având în vedere specializarea, nu este nimic surprinzător în numeroasele diferențe dintre TriMedia și Itanium - un procesor de uz general pentru servere de înaltă performanță O comandă TriMedia poate include până la cinci operațiuni În condiții complet optime, o instrucțiune este rulată pe ciclu de ceas și sunt selectate cinci operații Viteza nominală de ceas a procesorului este de sau MHz, dar întrucât se pot executa până la cinci operații într-un ciclu, viteza reală este de cinci ori mai mare În prezentarea ulterioară, vom trece de la caracteristicile implementării procesorului TM Alte versiuni de TriMedia au o serie de diferențe minore Comanda standard TriMedia este prezentată în fig Instrucțiunile variază în natură, de la instrucțiuni obișnuite cu numere întregi de , și de biți la instrucțiuni în virgulă mobilă IEEE și instrucțiuni de procesare media paralelă Execuția a cinci operații pe ciclu și disponibilitatea comenzilor pentru procesarea paralelă a datelor multimedia permit procesorului TriMedia să decodeze programatic streaming video digital provenit de la o cameră video, păstrând dimensiunea și rata de cadre originale Slot Slot Slot Slot Funcționare slot Adăugați Shift Multimedia Încărcare Salvare Comanda Orez Comanda TriMedia standard cu cinci operații TriMedia folosește memoria organizată pe octeți și mapează registrele I/O cu spațiul de memorie Jumătate de cuvinte ( biți) și cuvinte întregi ( de biți) sunt aliniate pe granițele naturale Ordinea octetilor poate fi mare sau mare, în funcție de bitul cuvântului de stare a programului setat de sistemul de operare Acest bit definește mecanismul de transfer de date pentru operațiunile de încărcare și stocare între memorie și registre Procesorul oferă un cache asociat cu căi partajat cu aceeași lungime de linie ( de octeți) în memoria cache de instrucțiuni și date Capacitatea cache-ului de instrucțiuni este de KB; capacitate cache de date - KB Există de registre universale pe de biți Valorile registrelor R și R sunt egale cu zero și, respectiv, unu hardware Restul de de registre sunt echivalente din punct de vedere funcțional și pot fi utilizate în orice scop În plus, sunt furnizate patru registre specializate pe de biți: un numărător de programe, un registru de cuvinte de stare a programului și două registre asociate întreruperilor În cele din urmă, un registru de de biți numără numărul de cicluri de procesor de la ultima resetare La o frecvență de ceas de MHz, ciclul complet al contorului este de de ani In-CPU Paralelism oѵo Procesorul Trimedia TM are blocuri funcționale AND concepute pentru a efectua operații aritmetice, logice și de control (există și un bloc de control cache, dar nu îl vom lua în considerare) Toate sunt enumerate în tabel Primele două coloane oferă numele blocului și o scurtă descriere a funcțiilor pe care acesta le îndeplinește A treia coloană indică numărul de copii hardware ale blocului A patra coloană conține valoarea așteptării (mai precis, numărul de cicluri) până la finalizarea operației În acest context, este util să rețineți că toate blocurile funcționale, cu excepția blocurilor rădăcină pătrată și diviziune în virgulă mobilă, sunt canalizate Deși așteptarea vă spune cât timp trebuie să așteptați înainte de a finaliza operația, nu trebuie să uitați că în fiecare nou ciclu puteți începe noi operațiuni Astfel, fiecare dintre cele trei comenzi consecutive poate conține două operații de încărcare, ceea ce înseamnă că șase operațiuni de încărcare pot fi simultan în diferite etape de execuție Tabelul Blocurile funcționale TM indicând numărul lor, întârziere și sloturi de comandă potrivite Bloc Descriere # Așteptați b Operaţii cu constante Operaţii cu adresare directă e Da Da Da Da Da Integer ALU -bit Aritmetică și logică Da Da Da Da Da Schimbări Schimbări pe mai mulți biți Da Da Da Da Da Încărcarea și salvarea accesărilor în memorie Da Da Înmulțirea întregului și în virgulă mobilă Înmulțirea întregului și în virgulă mobilă pe de biți Da Da ALU în virgulă mobilă Aritmetică în virgulă mobilă Da Da Comparaţie în virgulă mobilă Operaţii de comparare în virgulă mobilă Da Rădăcina pătrată și împărțirea numerelor în virgulă mobilă Împărțirea și rădăcina pătrată a numerelor în virgulă mobilă Da Gestionarea fluxului de lucru pentru tranziții Da Da Da DSP ALU Aritmetică multimedia (două cuvinte de biți sau patru de biți) Da Da Da Multiplicator pentru DSP Multiplicarea datelor multimedia (două cuvinte de biți sau patru de biți) Da Da o' Chimpschier Architecture În cele din urmă, ultimele șase coloane definesc alocarea comenzilor către blocurile funcționale De exemplu, operațiunile de comparare cu virgulă mobilă pot fi efectuate numai în al treilea slot de comandă Blocul funcțional de operare constantă este utilizat atunci când se efectuează operații de adresare directă, cum ar fi încărcarea unui număr dintr-un câmp operațional într-un registru ALU întreg efectuează adunări, scăderi, operații logice standard și operațiuni de împachetare și dezambalare Blocul de deplasare poate efectua deplasări de registru cu numărul specificat de biți în ambele direcții Blocul de încărcare și stocare citește cuvintele din memorie în registre și le scrie înapoi În general, TriMedia este un procesor RISC cu funcționalitate avansată, astfel încât operațiunile normale sunt efectuate cu registre, iar accesările la memorie sunt efectuate folosind un bloc funcțional de încărcare și stocare Transmisia se poate face pe , sau de biti La executarea comenzilor aritmetice și logice, memoria nu este accesată Blocul de multiplicare efectuează operații atât pe numere întregi, cât și pe numere în virgulă mobilă Următoarele trei blocuri sunt responsabile pentru adunarea și scăderea în virgulă mobilă, compararea, rădăcinile pătrate și împărțirea Operațiile de salt sunt executate de blocul funcțional de salt Tranziția este urmată de o întârziere fixă de trei cicluri, timp în care sunt executate întotdeauna trei instrucțiuni (adică până la operații) Acest lucru se întâmplă chiar și cu salturi necondiționate În cele din urmă, ajungem la două blocuri concepute pentru a efectua operațiuni multimedia speciale De fapt, operațiunile multimedia sunt efectuate de un procesor de semnal digital (Digital Signal Processor, DSP) Trebuie remarcat imediat că, spre deosebire de operațiile cu numere întregi bazate pe aritmetica complementului a doi, operațiile multimedia folosesc aritmetica saturată Dacă rezultatul unei operații nu poate fi exprimat din cauza unui depășire, în loc să se arunce o excepție sau să se întoarcă ca rezultat gunoi, se înlocuiește cel mai apropiat număr valid De exemplu, pentru numerele de biți fără semn, adăugarea a și ar duce la Deoarece unele operațiuni și sloturi de comandă sunt incompatibile, este obișnuit să existe mai puțin de cinci operații într-o comandă Dacă un anumit slot nu este utilizat, acesta trebuie comprimat pentru a minimiza consumul de spațiu Operațiile prezente în instrucțiune pot dura , sau de biți În funcție de numărul de operații conținute efectiv într-o comandă TriMedia, dimensiunea acesteia variază de la la de octeți (inclusiv supraîncărcarea de dimensiune fixă) Operațiile incluse într-o comandă TriMedia nu sunt verificate pentru compatibilitate în timpul execuției Prin urmare, operațiunile sunt executate chiar dacă sunt incompatibile, ceea ce generează un rezultat incorect Decizia de a abandona controalele a fost luată de dezvoltatori pentru a economisi timp și tranzistori În procesoarele Core i se efectuează verificări de compatibilitate pentru operațiile superscalare, totuși, ca urmare, soluția devine mai complicată, costurile de timp cresc, iar numărul de tranzistori utilizați crește În TriMedia, sarcina de a planifica Cunoștințele sunt transferate către compilator, care, fără constrângeri de timp nejustificate, poate optimiza plasarea operațiilor în cuvintele de instrucțiuni Cu toate acestea, dacă este necesar un bloc funcțional indisponibil pentru a executa o operație, întreaga comandă trebuie să aștepte până când devine din nou disponibilă La fel ca Itanium , operațiunile TriMedia sunt predictive Fiecare operație (cu două excepții minore) specifică un registru care trebuie verificat înainte de a executa operația respectivă Dacă bitul cel mai puțin semnificativ al acestui registru este setat, operația este executată; în caz contrar, se omite Fiecare dintre cele cinci (sau mai puține) tranzacții este prezisă individual Iată un exemplu de predicție a unei operații juvenile: IF R IADD R j R -> R Aici se verifică registrul R , iar dacă valoarea bitului său cel mai puțin semnificativ este egală cu unu, conținutul registrelor R și R este adăugat și stocat în R Operația poate fi făcută necondiționată folosind R ca registru de predicat (valoarea sa este întotdeauna ) Registrul R (zero hardware) face operația goală Operațiunile multimedia din TriMedia sunt împărțite în grupuri enumerate în tabel Multe dintre aceste operații folosesc tăierea, o tehnică în care un operand este „condus” într-un anumit interval pe baza valorilor minime sau maxime ale operanzilor din afara acelui interval Tăierea este disponibilă pentru operanzi pe biți, biți și de biți De exemplu, ca urmare a valorilor de tăiere de la la în intervalul de la la , rămân valori de la la Operațiile de tăiere sunt efectuate în grupul de tăiere Tabelul Principalele grupuri de operațiuni specializate în TriMedia Descrierea Grupului Decuparea Decuparea de patru octeți sau două jumătăți de cuvinte Obține valoare absolută (DSP) Obține valoare absolută, obține semn, decupează Adăugare (DSP) Adăugare semnată de valori cu tăiere Scăderea (DSP) Scăderea valorilor cu semn și tăiere Înmulțire (DSP) Înmulțirea valorilor cu semn și tăiere Obține minimum și maxim Obține minim sau maxim de patru n octeți Comparație Octet-cu-octet Comparație a două registre Shift Schimbați o pereche de operanzi pe biți Suma produselor Suma semnată a produselor de sau biți Fuzionarea, împachetarea, schimbarea octetilor și manipularea jumătate de cuvânt Medie pătratică octet cu octet Medie pătratică octet cu octet fără semn continuarea L Tabelul (continuare) Descrierea Grupului Medie pe octeți Media pe octeți cu patru elemente, fără a ține cont de semn Byte Multiply Înmulțiți valori de biți fără semn Estimarea mișcării Însumarea nesemnată a valorilor absolute semnate de biți Diverse Alte operatii aritmetice Următoarele cinci grupuri din tabel combina operații cu operanzi de diferite dimensiuni, prevăzând tăierea rezultatelor într-un anumit interval Operațiile de grup get min și max analizează două registre și găsesc valorile minime și maxime pentru fiecare octet În mod similar, într-un grup de comparație, două registre sunt tratate ca patru perechi de octeți, fiecare dintre acestea fiind comparat cu ceilalți Operațiunile multimedia sunt rareori efectuate pe numere întregi de de biți Acest lucru se datorează faptului că imaginile sunt de obicei construite în modelul de culoare RGB (roșu, verde, albastru) cu valori de pixeli roșu, verde și albastru de biți La procesarea (de exemplu, comprimarea) o imagine, aceasta este exprimată în trei componente, câte una pentru fiecare culoare (în spațiu RGB) sau într-o formă echivalentă logic (în spațiu YUV, despre care vom discuta în continuare) În orice caz, cea mai mare parte a calculelor este efectuată pentru matrici dreptunghiulare de numere întregi fără semn pe biți Pentru a procesa eficient astfel de matrici, TriMedia oferă numeroase operațiuni specializate Ca exemplu simplu, luați în considerare colțul din stânga sus al unei matrice de valori de biți stocate în memoria big endian (Figura a) Blocul x din acest colț conține valori de biți de la A la P Să presupunem că rezultatul transpunerii imaginii este matricea prezentată în Fig , b Cum se obține acest rezultat? ZIZY registrul a b Orez - - Matricea elementelor de biți (a); matricea transpusă (b); matricea originală transferată în patru registre (c); transpune matricea in patru registre (r) Transpunerea se poate face în operații, fiecare încarcă octeții în registre noi, după care trebuie efectuate încă operații pentru a plasa acei octeți la locul lor (rețineți că cei patru octeți diagonali nu sunt mutați în timpul transpunerii) Problema este că această schemă necesită de operații de memorie lungi și consumatoare de timp Există o altă cale În primul rând, sunt efectuate patru operații, fiecare încarcând un cuvânt în patru registre diferite - de la R la R (așa cum se arată în Fig , c) Apoi, folosind operații de mascare și deplasare, cele patru cuvinte rezultate sunt combinate și se formează rezultatul dorit (Fig , d) La sfârșitul cuvântului sunt stocate în memorie În ciuda reducerii semnificative a numărului de accesări la memorie (de la la ), eficiența acestei metode nu este ridicată din cauza mascării și deplasării - este nevoie de prea multe operațiuni pentru a extrage și a pune toți octeții în locurile potrivite TriMedia are o metodă mai bună Mai întâi, patru cuvinte sunt plasate în registre În acest caz, rezultatul este format nu prin mascare și deplasări, ci prin operații specializate de extragere și plasare octeți în registre Astfel, opt operații multimedia speciale și același număr de accesări la memorie sunt suficiente pentru a transpune o imagine Codul începe cu două operații de încărcare în segmentele și pentru a plasa cuvinte în registrele R și R , urmate de operații similare pentru a încărca în registrele R și R , Echipele care conțin aceste operațiuni pot folosi Segmentele , și în orice alt scop După încărcarea tuturor cuvintelor, operații multimedia speciale, împreună cu două operațiuni de salvare, pot fi împachetate în două comenzi care formează rezultatul În cele din urmă, sunt necesare doar instrucțiuni, din cele de sloturi rămânând disponibile pentru alte operațiuni, ceea ce înseamnă că numărul de sloturi corespunde cu aproximativ trei instrucțiuni pentru rezolvarea problemei Alte operațiuni multimedia sunt la fel de eficiente Datorită acestor operațiuni, precum și împărțirii comenzii în cinci sloturi, procesorul TriMedia se dovedește a fi un instrument extrem de eficient pentru procesarea datelor multimedia Multithreading în procesor Toate procesoarele moderne pipeline au aceeași problemă - dacă un cuvânt nu este găsit în cache-urile de la primul și al doilea nivel atunci când se solicită memorie, durează mult timp pentru a încărca acest cuvânt în cache, timp în care pipeline-ul este inactiv O tehnică pentru rezolvarea acestei probleme se numește multithreading pe cip Acesta permite procesorului să gestioneze simultan mai multe fire de execuție de program și, prin urmare, să mascheze timpii de inactivitate Pe scurt, principiul multithreading-ului poate fi enunțat după cum urmează: dacă firul de program este blocat, procesorul se poate asigura că hardware-ul este încărcat complet prin pornirea firului de program Ideea de bază este simplă, este implementată în diferite moduri, pe care le vom lua în considerare Prima dintre acestea, numită multithreading cu granulație fină, în raport cu un procesor capabil să apeleze o instrucțiune pe ciclu de ceas, este ilustrată în Fig Pe fig , a-c arată trei fluxuri de program (L, B, C) corespunzătoare la cicluri de mașină În timpul primului ciclu, firul A execută comanda L Deoarece această comandă se finalizează într-un ciclu, atunci când are loc al doilea ciclu, comanda D este pornită Accesul său la memoria cache de primul nivel nu reușește, așa că trec două cicluri înainte ca cuvântul dorit să fie preluat din memoria cache de nivel al doilea Execuţie Capitolul Arhitecturi de calculatoare paralele firul continuă în bucla După cum se arată în figură, firele B și C sunt, de asemenea, în mod regulat inactiv Ca parte a acestei soluții, următoarea comandă nu este apelată până când cea anterioară nu este finalizată Mai precis, în prezența unui contor de lovituri complex, în unele cazuri acest lucru este permis, dar pentru simplitate excludem o astfel de posibilitate A A A A A A A A A B C A B C A B C A B C B B B B B B B B C C C C C C C C A A B C C C C A A A Ciclu - Ciclu - Orez Trei fluxuri de programe Pătratele goale înseamnă inactiv așteptarea datelor din memorie (a-b); multithreading cu granulație fină (d); multithreading grosier (d) Cu multithreading cu granulație fină, timpul de inactivitate este mascat prin executarea firelor „într-un cerc”, adică diferite fire sunt lansate în cicluri adiacente (Fig , d) Până la sosirea ciclului de timp , accesul la memorie inițiat de instrucțiunea A s-a încheiat, deci chiar dacă instrucțiunea A are nevoie de rezultatul instrucțiunii A , pornește În acest caz, durata maximă de inactivitate este de două cicluri, ceea ce înseamnă că, dacă există trei fire de execuție de program, operațiunea de inactivitate încă se finalizează la timp Cu un timp inactiv de cicluri, ar fi necesare fire de program pentru funcționarea continuă etc Deoarece firele de execuție diferite ale programului nu sunt legate între ele în niciun fel, fiecare dintre ele are nevoie de propriul set de registre Trebuie specificat pentru fiecare instrucțiune apelată, iar apoi hardware-ul va ști ce set de registre să acceseze atunci când este necesar Prin urmare, numărul maxim de fire de execuție simultană a programului este determinat în timpul dezvoltării cipului Cauzele timpului de nefuncționare nu se limitează la accesările la memorie Uneori, executarea instrucțiunii următoare necesită rezultatul instrucțiunii anterioare, care nu a fost încă evaluată În alte cazuri, comanda nu poate fi apelată deoarece urmează o ramură condiționată a cărei direcție nu este încă cunoscută Regula generală este formulată după cum urmează: dacă există k pași în conductă, dar cel puțin k fire de execuție de program pot fi lansate într-un cerc, atunci mai mult de o comandă nu pot fi executate într-un fir la un moment dat, deci conflicte între ele sunt excluse Într-o astfel de situație, procesorul poate rula la viteză maximă fără repaus Desigur, numărul de fire disponibile nu este întotdeauna egal cu numărul de etape de conductă, așa că unii dezvoltatori preferă o tehnică numită multithreading cu granulație grosieră, care este ilustrată în Fig , e În acest caz, firul de execuție al programului A continuă să fie executat secvențial, până la timpul inactiv În acest caz, se pierde un ciclu Apoi există o comutare la prima comandă a fluxului de program B (fii) Deoarece această comandă intră imediat în starea inactivă, în bucla se utilizează Paralelism în CPU multithreadingul cu granulație grosieră cu un singur ciclu ar părea a fi inferioară multithreadingului cu granulație fină în ceea ce privește eficiența sa, dar are un avantaj semnificativ - datorită unui număr mai mic de fire de execuție a programului, reduceți semnificativ consumul de resurse ale procesorului Cu un număr insuficient de fluxuri active, această tehnică este optimă Pe baza descrierii noastre, multithreadingul grosier comută pur și simplu între fire, dar acesta nu este singurul curs posibil de acțiune De asemenea, este posibil să comutați imediat (a comenzilor care ar putea cauza timp inactiv (de exemplu, salvarea încărcării și salturi) fără a afla dacă timpul de inactivitate este de fapt planificat Această strategie vă permite să comutați mai devreme decât de obicei (imediat după ce instrucțiunea este planificată) decodificat) și elimină bucle nesfârșite Cu alte cuvinte, execuția continuă până când se descoperă posibilitatea unei probleme, după care urmează o comutare Indiferent de varianta multithreading utilizată, este necesar să urmăriți cumva apartenența fiecărei operații la unul sau la altul fir de program În cadrul multithreadingului cu granulație fină, pentru fiecare operație, ID-ul firului este trecut prin glisare, astfel încât atunci când vă deplasați de-a lungul conductei | r, apartenența sa este fără îndoială Multithreading la scară largă oferă posibilitatea de a curăța conducta înainte de a începe fiecare fir de execuție, dar următorul În acest caz, identitatea firului de execuție curent este clar definită Desigur, această tehnică este eficientă numai dacă pauzele dintre comutare sunt mult mai lungi decât timpul necesar pentru eliberarea transportorului Toate cele de mai sus se aplică procesoarelor care nu pot apela mai mult de o instrucțiune pe ciclu de ceas Cu toate acestea, știm că această limitare nu este relevantă pentru procesele moderne În ceea ce privește imaginea din fig І presupunem că procesorul poate apela două instrucțiuni pe ciclu, o declarație despre imposibilitatea de a rula instrucțiuni ulterioare în cazul simplu; cea precedentă rămâne în vigoare Figura a ilustrează mecanismul multithreadingului micromodular într-un procesor superscalar dublu După cum puteți vedea în firul A, primele două comenzi sunt executate în timpul primului ciclu, dar în firul B, doar o comandă este rulată în al doilea ciclu А С AZ В СЗ А ВЗ С А В С A C A C B C A B C Ciclu - A A B £ NW AZ A B C A A B B A C C A C A B B Ciclul -► b ÎN C A LA C A VZ LA LA C NV AZ A C A A LA LA LA C Ciclu - în Pe fig , arată implementarea multithreadingului grosier într-un procesor dual cu un planificator static care elimină bucle infinite atunci când instrucțiunile inactiv Aici, firele de execuție ale programului sunt executate pe rând, procesorul apelează câte două instrucțiuni în fiecare fir, până când detectează timpul de inactivitate; în ciclul următor după timpul de inactivitate, începe execuția firului următor În procesoarele superscalare, există o altă modalitate de a organiza multithreading - așa-numitul multithreading sincron (multithreading simultan), care este ilustrat în Fig , c Aceasta tehnica este o imbunatatire a multithreading-ului cu granulatie grosiera, in care fiecare thread de program poate rula doua instructiuni per clock, dar atunci cand este inactiv, instructiunile urmatorului thread sunt rulate pentru a asigura utilizarea completa a procesorului Cu multithreading sincron, toate blocurile funcționale sunt încărcate complet Dacă comanda nu poate fi pornită deoarece blocul funcțional este ocupat, este selectată comanda dintr-un alt fir Figura presupune că instrucțiunea B este inactivă în bucla AND, astfel încât instrucțiunea C este pornită în bucla Pentru mai multe informații despre multithreading, a se vedea [Gebhart et al , ; Wingkei et al , ] Multithreading în Cor i După ce s-a ocupat de teoria multithreading-ului, luați în considerare un exemplu practic - Core i La începutul anilor , procesoare precum Pentium nu mai asigurau creșterea performanței de care Intel avea nevoie pentru a menține vânzările Chiar și după ce procesorul Pentium a intrat în producție, inginerii Intel au continuat să lucreze la îmbunătățirea performanței acestuia fără a aduce modificări interfeței software Au apărut rapid cinci moduri simple Creșterea frecvenței ceasului Plasarea a două procesoare pe un cip Introducerea de noi blocuri funcționale Prelungirea transportorului Folosind multithreading Cea mai evidentă modalitate de a îmbunătăți performanța este de a crește viteza ceasului fără a modifica alți parametri De regulă, fiecare model de procesor ulterior are o viteză de ceas puțin mai mare decât precedentul Din păcate, cu o creștere în linie dreaptă a vitezei de ceas, dezvoltatorii se confruntă cu două probleme: un consum crescut de energie (care este relevant pentru laptopuri și alte dispozitive de calcul care funcționează cu baterii) și supraîncălzire (care necesită radiatoare mai eficiente) A doua metodă - plasarea a două procesoare pe un cip - este relativ simplă, dar presupune dublarea suprafeței ocupate de cip Dacă fiecare procesor este prevăzut cu propria sa memorie cache, numărul de cipuri per wafer se reduce la jumătate, dar asta înseamnă și costul de producție de două ori Dacă este furnizată o cache partajată pentru ambele procesoare, o creștere semnificativă a suprafeței ocupate poate fi evitată, dar în acest caz apare o altă problemă - cantitatea de memorie cache per procesor este redusă la jumătate, iar acest lucru afectează inevitabil performanța În plus, în timp ce aplicațiile de server de înaltă performanță pot utiliza pe deplin resursele mai multor procesoare, programele desktop obișnuite au mult mai puțin paralelism intern Adăugarea de noi blocuri funcționale nu este dificilă, dar este important să găsim un echilibru aici Ce rost are o duzină de ALU dacă cipul nu poate emite comenzi către conductă la o rată care să poată încărca toate acele blocuri? O conductă cu un număr crescut de etape, capabilă să împartă sarcinile în segmente mai mici și să le proceseze în perioade scurte de timp, pe de o parte, îmbunătățește performanța, pe de altă parte, crește consecințele negative ale previziunii greșite a tranzițiilor, ratelor de cache, întreruperi și alte evenimente care perturbă procesarea normală a instrucțiunilor de curs în procesor În plus, pentru a realiza pe deplin capacitățile conductei extinse, este necesară creșterea frecvenței de ceas, iar acest lucru, după cum știm, duce la un consum crescut de energie și la disiparea căldurii În cele din urmă, puteți implementa multithreading Avantajul acestei tehnologii este introducerea unui thread software suplimentar care permite) aducerea în uz a acelor resurse hardware care altfel ar fi inactive Pe baza rezultatelor studiilor experimentale, dezvoltatorii Intel au descoperit că o creștere cu % a suprafeței cipului atunci când se implementează multithreading pentru multe aplicații oferă o creștere a performanței de % Primul procesor Intel care a suportat multithreading a fost Cheop din Ulterior, începând cu , GHz, multithreading a fost introdus în linia Pentium (inclusiv Cope I ) Intel numește implementarea multithreading-ului în procesoarele sale hyperthreading Principiul principal al hyperthreading-ului este executarea simultană a două fire de execuție de program (sau procese - procesorul nu face distincție între procese și fire de execuție) Sistemul de operare tratează procesorul hyper-threaded Coge i ca pe un complex cu două procesoare cu cache partajate și memorie principală Sistemul de operare efectuează planificarea pentru fiecare fir de program separat Astfel, două aplicații pot rula în același timp De exemplu, un demon de e-mail poate trimite sau primi mesaje în fundal în timp ce utilizatorul interacționează cu o aplicație interactivă - adică demonul și programul utilizatorului se execută în același timp, ca și cum două procesoare ar fi disponibile pentru sistem Programele de aplicație capabile să se execute în mai multe fire pot folosi atât „procesoare virtuale” De exemplu, programele de editare video permit utilizatorilor să aplice filtre pentru toate cadrele Astfel de filtre corectează luminozitatea, contrastul, echilibrul de culoare și alte proprietăți ale cadrelor Într-o astfel de situație, programul poate atribui unui procesor virtual să proceseze cadrele pare, iar altul să proceseze cadrele impare În acest caz, cele două procesoare vor funcționa complet independent unul de celălalt Deoarece firele de execuție software accesează aceleași resurse hardware, este necesară coordonarea acestor fire În contextul hyperthreading-ului, dezvoltatorii Intel au identificat patru strategii utile de gestionare a partajării resurselor: duplicarea resurselor și partajarea hard, threshold și completă a resurselor Să aruncăm o privire asupra acestor strategii Să începem cu duplicarea resurselor După cum știți, unele resurse sunt duplicate pentru a organiza fluxurile de programe De exemplu, deoarece fiecare fir de program are nevoie de control individual, este necesar un al doilea contor de program În plus, este necesară introducerea unui al doilea tabel pentru maparea registrelor arhitecturale (EAX, EBX etc ) la registrele fizice; controlerul de întrerupere este duplicat în mod similar, deoarece procesarea întreruperii pentru fiecare fir se face individual Aceasta este urmată de o tehnică de partiţionare solidă a resurselor (partajarea resurselor partiţionate) între firele de execuţie a programului De exemplu, dacă procesorul are o coadă între două etape funcționale ale conductei, atunci jumătate din sloturi pot fi date firului , cealaltă jumătate firului Partajarea resurselor este ușor de implementat, nu duce la dezechilibru și asigură independența completă a firelor de execuție a programului unul față de celălalt Odată cu separarea completă a tuturor resurselor, un procesor se transformă de fapt în două Pe de altă parte, poate apărea o situație în care un fir de execuție de program nu utilizează resurse care ar putea fi utile celui de-al doilea fir, dar pentru care nu are drepturi de acces Ca urmare, resursele care ar putea fi utilizate altfel sunt inactive Opusul partajării dure este partajarea completă a resurselor În această schemă, orice fir de program poate accesa resursele necesare și sunt deservite în ordinea în care sunt solicitate Să considerăm o situație în care un flux rapid, constând în principal din operații de adunare și scădere, coexistă cu un flux lent, care implementează operații de înmulțire și împărțire Dacă instrucțiunile sunt apelate din memorie mai repede decât sunt efectuate operațiunile de înmulțire și împărțire, numărul de instrucțiuni apelate în firul lent și puse în coadă pe conductă va crește treptat În cele din urmă, aceste comenzi vor umple coada, ca urmare, fluxul rapid se va opri din cauza lipsei de spațiu în el Partajarea completă a resurselor rezolvă problema utilizării suboptime a resurselor partajate, dar creează un dezechilibru în consumul acestora - un fir poate încetini sau opri altul Schema intermediară este implementată în cadrul partajării resurselor de prag Conform acestei scheme, orice fir de program poate primi dinamic o anumită cantitate (limitată) de resurse Când este aplicată resurselor replicate, această abordare oferă flexibilitate fără amenințarea ca unul dintre firele de execuție a programului să fie inactiv din cauza incapacității de a obține resurse Dacă, de exemplu, fiecăreia dintre fire i se interzice să ocupe mai mult de / din coada de comenzi, consumul crescut de resurse de către firul lent nu va interfera cu execuția celui rapid Modelul Hyperthreading I combină diferite strategii de partajare a resurselor Astfel, se încearcă rezolvarea tuturor problemelor asociate fiecărei strategii Dublarea este implementată în raport cu resursele, accesul la care este cerut constant de ambele programe fire de execuție (în special, în ceea ce privește contorul de programe, tabelul de mapare a registrului și controlerul de întrerupere) Dublarea acestor resurse crește aria microcircuitului cu doar % - veți fi de acord că este un preț destul de rezonabil pentru multithreading Resursele care sunt disponibile într-un astfel de volum încât este practic imposibil ca acestea să fie capturate de un singur fir (de exemplu, linii cache) sunt alocate dinamic Accesul la resursele care controlează funcționarea conductei (în special, numeroasele sale cozi) este împărțit - fiecărui fir de program i se acordă jumătate din sloturi Conducta principală a arhitecturii Sandy Bridge implementată în Cor І este prezentată în Fig , ; zonele albe și gri din această ilustrație reprezintă mecanismul de alocare a resurselor între firele de execuție albe și gri ale programului Orez Partajarea resurselor între firele de execuție a programului în microarhitectura Coge După cum puteți vedea, toate cozile din această ilustrație sunt împărțite - fiecărui fir de program îi este alocată jumătate din sloturi Niciunul dintre firele ps nu poate restricționa munca celuilalt Blocul de distribuție și substituție este de asemenea împărțit Resursele planificatorului sunt partajate dinamic, dar pe baza unor valori de prag - astfel, niciunul dintre fire nu poate ocupa toate sloturile cozii Pentru toate celelalte etape ale transportorului, există o separare completă Cu toate acestea, multithreadingul nu este atât de simplu Chiar și această tehnică avansată are dezavantajele ei Partiționarea hard a resurselor nu este asociată cu costuri serioase, dar partiționarea dinamică, în special în ceea ce privește pragurile, necesită monitorizarea consumului de resurse în timpul execuției În plus, în unele cazuri programele funcționează mult mai bine fără multithreading decât cu acesta Să presupunem, de exemplu, că dacă există două fire de execuție de program, fiecare dintre ele are nevoie de / din memoria cache pentru a funcționa corect Dacă ar fi executate pe rând, fiecare ar funcționa rezonabil de bine cu un număr mic de erori de cache (care sunt cunoscute a fi asociate cu supraîncărcare suplimentară) În cazul execuției paralele, ar exista semnificativ mai multe rateuri de cache pentru fiecare, iar rezultatul final ar fi mai rău decât fără multithreading Pentru mai multe informații despre mecanismul multithreading în procesoarele Intel, vezi [Gerber și Binstock, ; Gepner și colab , ] Multiprocesoare cu un singur cip În timp ce multithreading poate oferi îmbunătățiri semnificative de performanță la un cost rezonabil, unele aplicații au nevoie de performanță semnificativ mai mare și multithreading nu este suficient Pentru astfel de aplicații, există scheme multiprocesor Cipurile care acceptă două sau mai multe procesoare sunt utilizate în principal în serverele profesionale și în electronicele de larg consum Despre toate acestea vom vorbi acum Multiprocesoare omogene cu un singur cip Datorită dezvoltării tehnologiei VLSI (Very Large Scale Integrated Circuit), două sau mai multe procesoare puternice pot fi acum instalate pe un singur cip Deoarece aceste procesoare accesează întotdeauna aceleași module de memorie (cache-urile L și L și memoria principală), ele sunt considerate a fi un singur multiprocesor, așa cum am văzut în Capitolul Acestea sunt de obicei instalate în fermele mari de servere web Prin colocarea a două procesoare, separarea resurselor de memorie, a discului și a interfețelor de rețea, performanța serverului poate fi în multe cazuri dublată, iar costul de a face acest lucru va crește într-o măsură mult mai mică (deoarece chiar dacă un multiprocesor costă de două ori mai mult decât un procesor obișnuit, nu uitați că prețul său este doar o mică parte din costul total al sistemului) Există două modele tipice pentru multiprocesoarele mici cu un singur cip În primul dintre ele (Fig , a) există un microcircuit și două conducte - astfel, viteza de execuție a instrucțiunilor se dublează teoretic În a doua soluție (Fig , b), microcircuitul oferă două nuclee independente, fiecare dintre ele conține un procesor cu drepturi depline Un nucleu este un cip mare (cum ar fi un procesor, un controler I/O sau cache) care se află pe un cip ca modul, de obicei împreună cu alte câteva nuclee a b Orez Multiprocesoare cu un singur cip: un cip cu două conducte (a); cip cu două nuclee (b) Prima soluție permite partajarea resurselor (cum ar fi blocuri funcționale) între procesoare; cu alte cuvinte, fiecare procesor poate accesa resurse care nu sunt solicitate de celălalt procesor A doua soluție necesită o modificare a designului microcircuitului și nu prevede mai mult de două procesoare Trebuie remarcat aici că nu este atât de dificil să plasați două sau mai multe nuclee de procesor pe un cip În continuare, pe măsură ce prezentarea avansează, vom reveni la subiectul multiprocesoarelor În acest capitol, acoperim în principal subiecte legate de multiprocesoare bazate pe cipuri cu un singur procesor, dar multe dintre ele se aplică cipurilor cu mai multe procesoare Multiprocesor Sore I cu un singur cip Coge i este un multiprocesor cu un singur cip fabricat cu patru sau mai multe nuclee pe un singur substrat de siliciu Structura de nivel înalt a procesorului Core i este prezentată în fig cache L Procesor IA- Rețea de apel cache L IA- Procesor і servere și computere personale În plus, există nenumărate dispozitive intermediare diferite care operează în rețele, inclusiv routere, comutatoare, firewall-uri, servere proxy și sisteme echilibrarea sarcinii În mod curios, aceste sisteme intermediare sunt supuse celor mai severe cerințe - trebuie să asigure transmiterea unui număr maxim de pachete pe secundă În plus, serverelor sunt impuse cerințe serioase, deoarece pentru computerele utilizatorilor, nu există cerințe speciale pentru acestea În funcție de rețea și de pachetul în sine, un pachet care ajunge în rețea pentru transfer, ieșire sau transmitere către o aplicație poate necesita o anumită formă de procesare Procesarea poate include decizia unde să trimiteți pachetul, împărțirea pachetului în părți sau reasamblarea ypritzѵiiiirm PCI Orez Cristal și placa unui procesor de rețea tipic pachete și protocoale), fiecare dintre ele constând dintr-un nucleu RISC (eventual modificat) și o mică memorie internă pentru stocarea programului și a mai multor variabile Există două abordări pentru organizarea controlorilor EIP În cel mai simplu caz, controlerele PPE sunt realizate identice Când un nou pachet ajunge la procesorul de rețea, acesta este transmis controlerului PPE care este în prezent inactiv pentru procesare Dacă nu există controlere PPE libere, puneți pachetul în coadă în memoria SDRAM aflată pe placă, așteptând ca unul dintre controlerele PPE să devină liber Cu o astfel de organizare, conexiunile orizontale prezentate în Fig nu sunt prezente, deoarece controlorii EIP diferiți nu * au nevoie să comunice între ei O altă abordare a organizării controlorilor PPE este o conductă, în care fiecare controlor PPE realizează un pas de procesare și apoi transmite un pointer către pachetul primit următorului controler PPE din conductă Această conductă funcționează aproape în același mod ca și conductele CPU discutate în Capitolul În ambele aranjamente, controlerele PPE sunt complet programabile La procesoarele de rețea mai avansate, controlerele PPE sunt multi-threaded, ceea ce înseamnă că fiecare are mai multe seturi de registre și un registru hardware care indică ce set este în uz Acest lucru permite mai multor programe (adică fire de execuție) să ruleze simultan și să comute între ele pur și simplu prin schimbarea variabilei „setul curent de registru de lucru” Când unul dintre firele de execuție a programului este forțat să aștepte (de exemplu, la accesarea SDRAM, care necesită mai multe cicluri), controlerul PPE poate fi comutat instantaneu la un fir care poate continua să funcționeze Acest lucru permite controlerului PPE să fie foarte încărcat, chiar dacă adesea trebuie să aștepte ca transferurile de date SDRAM sau alte operațiuni externe lente să se finalizeze Pe lângă controlerele PPE, toți procesoarele de rețea au un procesor de control pentru a efectua toate acțiunile care nu au legătură directă cu procesarea pachetelor (de exemplu, actualizarea tabelelor de rutare) De obicei, este un procesor RISC de uz general, a cărui memorie pentru date și comenzi se află pe același cip cu procesorul Mai mult, un procesor de rețea poate avea mai multe procesoare specializate dedicate operațiunilor critice Sunt circuite integrate specifice aplicației (ASIC) foarte mici, capabile să efectueze o singură acțiune simplă, cum ar fi căutarea unei adrese de destinație într-un tabel de rutare Toate componentele procesorului de rețea comunică între ele la viteze multi-gigabit prin una sau mai multe magistrale paralele pe cip Procesarea pachetelor Indiferent dacă procesorul de rețea are o organizare pipeline sau paralelă, fiecare pachet care sosește trece prin mai multe etape de procesare Pentru unele procesoare, aceste etape sunt împărțite în procesare de intrare (procesare de intrare) și procesare de ieșire (procesare de ieșire) Primul grup include operațiuni cu pachete care au venit din exterior (printr-o linie de rețea sau magistrală de sistem), iar al doilea grup include operațiuni cu pachete înainte ca acestea să fie trimise Astfel, fiecare pachet este supus mai întâi procesării de intrare și apoi procesării de ieșire Această împărțire este destul de arbitrară, deoarece unele operațiuni pot fi efectuate în orice etapă (de exemplu, colectarea de informații despre trafic) Vom parcurge acești pași în ordinea în care ar putea fi făcute, dar rețineți că nu trebuie să fie făcute pentru toate pachetele, iar alte secvențe sunt posibile Verificarea sumei de control Dacă un pachet de intrare sosește dintr-o rețea Ethernet, suma sa de control (codul CRC) este recalculată și comparată cu valoarea prezentă în pachet pentru a se asigura că pachetul a fost primit fără erori Dacă ambele valori sunt egale sau dacă nu există un câmp CRC în pachetul Ethemet, suma de control a pachetului IP este calculată și comparată cu valoarea din pachet Acest lucru asigură că pachetul IP nu a fost corupt de un bit rău din memoria expeditorului după ce expeditorul a calculat suma de control pentru pachetul IP Dacă toate verificările sunt trecute, pachetul este trecut pentru procesare ulterioară, în caz contrar, este pur și simplu aruncat Extragerea valorilor câmpului Prin parsare, se determină poziția antetului necesar, iar valorile câmpurilor cheie corespunzătoare acestui antet sunt extrase din pachet Într-un comutator Ethernet, este examinat doar antetul Ethemet; într-un router IP, doar antetul IP Valorile câmpurilor cheie sunt stocate fie în registre (cu organizare paralelă a controlerelor PPE), fie în SRAM (cu organizare pipeline) Clasificarea pachetelor Pachetele sunt clasificate conform unui set de reguli de programare În cel mai simplu caz, pachetele de date sunt separate de pachetele de control, dar separarea este de obicei mult mai subtilă Alegerea căii Majoritatea procesoarelor de rețea au o cale rapidă specială, care este optimizată pentru a transporta o varietate de pachete de date, în timp ce restul pachetelor sunt procesate în felul lor, de obicei prin control procesor leneș În consecință, este selectată fie calea rapidă, fie una dintre căile lente Definirea retelei tinta Pachetele IP conțin o adresă de destinație pe de biți Cu toate acestea, este imposibil (și nedorit) să folosiți un întreg tabel de de intrări pentru a găsi destinatarul fiecărui pachet Prin urmare, partea stângă a adresei conține de obicei adresa rețelei, în timp ce partea dreaptă indică către o singură mașină din acea rețea Lungimea adresei de rețea nu este fixă, astfel încât determinarea acesteia nu este o sarcină banală și este și mai complicată de faptul că sunt permise mai multe opțiuni, dintre care cea mai lungă este considerată corectă În acest pas, este adesea folosit un ASIC Căutare rută După determinarea adresei rețelei țintă dintr-un tabel stocat în SRAM, rezultă care dintre liniile de ieșire trebuie să trimită pachetul Din nou, un ASIC poate fi folosit în acest pas Avarie si montaj Aplicațiile maximizează adesea sarcina utilă (date) pachetelor TCP în încercarea de a reduce numărul de apeluri de sistem, dar atât TCP, IP, cât și Ethernet au limite privind dimensiunea maximă a pachetului Ca o consecință a acestor limitări, poate fi necesar să spargeți pachetele (și, prin urmare, încărcătura utilă) în bucăți înainte de a le trimite și să le reasamblați la capătul de primire Aceste funcții pot fi efectuate de procesorul de rețea Calcule Uneori este necesară efectuarea anumitor calcule complexe asupra datelor, de exemplu, efectuarea compresiei și decompresiei, codificarea și decodarea Aceste acțiuni pot fi transferate către procesorul de rețea Gestionați anteturile Uneori trebuie să adăugați sau să eliminați anteturi, precum și să modificați valorile anumitor câmpuri De exemplu, în antetul IP există un contor al numărului de hopuri pe care pachetul le poate trece înainte de a se autodistruge După trecerea fiecărei tranziții, valoarea contorului trebuie să fie redusă cu unul, iar această funcție poate fi îndeplinită de procesorul de rețea Managementul cozilor Pachetele de intrare și de ieșire trebuie adesea să stea la coadă pentru a fi procesate Dar pentru aplicațiile multimedia, pentru a evita jitterul, este necesar ca întârzierile dintre pachete să nu depășească o anumită valoare În plus, un firewall sau un router poate avea nevoie să redistribuie sarcina de intrare între mai multe linii de ieșire conform anumitor reguli Toate aceste sarcini pot fi rezolvate de procesorul de rețea Generarea de sume de control Pachetele de ieșire trebuie să aibă sume de control Suma de control a pachetelor IP poate fi calculată de procesorul de rețea, în timp ce suma de control a pachetelor Ethernet este, în general, generată de hardware Contabilitate În unele cazuri, este necesar să se contorizeze traficul pe măsură ce acesta trece pachete, mai ales dacă una dintre rețele oferă tranzitul traficului ca serviciu comercial Contabilitatea poate fi gestionată de procesorul de rețea Culegerea de statistici Multe companii ar dori să aibă statistici de trafic: câte pachete au intrat, câte pachete au ieșit, când s-a întâmplat, etc Procesoarele de rețea pot colecta aceste informații Creșterea productivității I Performanța este cea mai importantă caracteristică a procesoarelor de rețea Ce se poate face pentru a-l îmbunătăți? Înainte de a răspunde la această întrebare, este necesar să definim ce este Una dintre metrici este numărul de pachete transmise pe secundă, cealaltă este numărul de octeți transmiși pe secundă Aceste valori au abordări diferite, iar o schemă care funcționează bine cu pachetele mici poate să nu funcționeze bine cu cele mari În special, atunci când transmiteți pachete mici, puteți îmbunătăți considerabil performanța prin accelerarea căutării adresei țintă în tabel, în timp ce, în același timp, atunci când transmiteți pachete mari, acest lucru nu va oferi o creștere vizibilă a performanței Cea mai directă modalitate de a îmbunătăți performanța este creșterea frecvenței de ceas a procesorului de rețea Adevărat, performanța nu crește proporțional cu frecvența, deoarece timpul de acces la memorie și o serie de alți factori afectează În plus, o frecvență mai mare înseamnă că trebuie disipată mai multă căldură De obicei, soluția este creșterea numărului de controlere PPE - această abordare este eficientă în special pentru arhitecturile paralele Creșterea lungimii conductei poate ajuta, de asemenea, dar numai dacă este posibilă împărțirea procesului de procesare a unui pachet în pași destul de simpli O altă abordare este creșterea numărului de procesoare suplimentare specifice aplicației sau de circuite integrate specifice aplicației dedicate anumitor operațiuni costisitoare și solicitate frecvent, dacă astfel de operațiuni sunt efectuate mai eficient în hardware Printre mulți candidați se numără căutări în tabel, sumă de verificare și operațiuni criptografice De asemenea, puteți crește viteza prin reducerea timpului de tranzit al pachetelor în sistem prin introducerea de autobuze suplimentare și creșterea numărului de linii în cele existente În cele din urmă, câștigurile de performanță pot fi obținute de obicei prin înlocuirea cipurilor de memorie (SRAM în loc de SDRAM), dar acest lucru, desigur, afectează costul Desigur, acest lucru nu este tot ce se poate spune despre procesoarele de rețea Pentru mai multe informații vezi [Freitas et al , ; Lin și colab , ; Yamamoto și Nakao, ] GPU-uri A doua zonă de aplicare a coprocesoarelor este procesarea graficelor de înaltă rezoluție (de exemplu, generarea de imagini D) Procesoarele convenționale nu sunt suficient de eficiente pentru calcule complexe cu cantități mari de date Din acest motiv, unele computere personale moderne și majoritatea modelelor în curs de dezvoltare sunt echipate cu co-procesoare speciale de procesare grafică, pe care o parte semnificativă a lucrării poate fi deplasată GPU NVIDIA Fermi O zonă de procesare grafică care crește constant în importanță, vom studia exemplul NVIDIA Fermi, o arhitectură folosită într-o familie de procesoare grafice cu viteze și dimensiuni diferite Arhitectură Coprocesoare procesorul grafic b'erini este prezentat in fig Este format din multiprocesoare de streaming sau SM (Streaming Multiproccssors), fiecare cu propriul cache L cu lățime de bandă mare Fiecare multiprocesor de streaming conține de nuclee C UDA; Astfel, GPU-ul Fermi conține în total nuclee CIJDA Nucleul CUDA (Compute Unified Device Architecture) este simplu! procesor cu suport pentru calcule întregi cu precizie unică și calcule în virgulă mobilă Un bloc SM cu de nuclee cu UDA este prezentat în fig Cele SM-uri partajează un cache L combinat de MB conectat la o interfață DRAM multiport Interfața procesorului de control oferă un canal de comunicare între sistemul de control și GPU printr-o magistrală DRAM comună (de obicei printr-o interfață PCI-Express) Orez Arhitectura GPU Fermi Arhitectura Fermi este concepută pentru a executa în mod eficient codul de procesare grafică și video care implică de obicei calcule redundante semnificative răspândite pe mulți pixeli Din cauza acestei redundanțe, multiprocesoarele de streaming capabile să efectueze până la operațiuni simultan necesită ca toate operațiunile efectuate într-un ciclu să fie identice Acest stil de procesare se numește SIMD (Singlc Instruction Multiple Data); avantajul său major este că fiecare SM preia și decodifică doar o instrucțiune pe ciclu Prin coprocesarea comenzilor numai în toate nucleele SM, NVIDIA a reușit să încadreze nuclee într-o singură placă de siliciu Dacă programatorii pot utiliza pe deplin întreaga putere de calcul a lui Fermi (deși acest lucru Capitolul Arhitecturi de calculatoare paralele ♦dacă” arată întotdeauna vag), sistemul va depăși semnificativ arhitecturile scalare tradiționale, cum ar fi Coge I sau OMAP Cerințele specifice ale SIMD în SM impun restricții asupra codului care poate fi executat de programatori în aceste blocuri Pentru a executa toate cele operațiuni în același timp, fiecare nucleu CUDA trebuie să execute același cod Pentru a ușura munca programatorului, NVIDIA a dezvoltat limbajul de programare CUDA, care definește paralelismul programului folosind firele de execuție Fluxurile de programe sunt grupate în blocuri care sunt atribuite procesoarelor de flux Dacă fiecare fir de execuție dintr-un bloc execută aceeași secvență de instrucțiuni (adică aceleași decizii sunt luate în toate ramurile), pot fi efectuate până la operații simultan (presupunând că până la fire sunt gata de executat) Atunci când firele de execuție ale diferitelor SM-uri iau decizii diferite, apare un efect de degradare a performanței, din cauza căruia firele de execuție de program cu căi diferite sunt executate secvențial Acest efect reduce gradul de paralelism și încetinește GPU-ul Din fericire, în domeniul procesării grafice, există o gamă largă de operațiuni care ajută la evitarea efectului de încetinire și la obținerea unor performanțe bune Multe tipuri de cod beneficiază de execuție în arhitecturile SIMD: imagistică medicală, prognoză financiară, analiză grafică etc Odată cu extinderea gamei de aplicații potențiale ale GPU-urilor, noul nume GPGPU (General-Purpose Graphics Processing Units) le-a lipit Chiar și cu nuclee CUDA, GPU-ul Fermi va fi paralizat fără o lățime de bandă semnificativă a memoriei Pentru a face acest lucru, GPU-ul Fermi implementează ierarhia modernă de memorie prezentată în Fig Fiecare SM folosește atât memoria partajată, cât și propriul cache de date de nivel Memoria partajată este adresată direct de nucleele CUDA și permite partajarea rapidă a datelor între firele din același SM Cache-ul de nivel accelerează gestionarea datelor în DRAM În funcție de gama largă de utilizare a datelor de program, aceste SM-uri pot fi echipate fie cu memorie partajată de K cu cache de nivel de K, fie cu memorie partajată de K cu cache de nivel de K Toate SM-urile folosesc un cache de nivel combinat pentru KB Cache-ul L oferă acces rapid la datele DRAM care nu se potrivesc în memoria cache L Cache-ul L permite, de asemenea, partajarea datelor zilnice între SM-uri, deși acest mod este mult mai lent decât SM-urile partajate În spatele memoriei cache L se află DRAM, care stochează restul datelor, informațiilor grafice și texturilor utilizate de programele care rulează pe GPU-ul Fermi Programele eficiente ar trebui să evite utilizarea DRAM ori de câte ori este posibil, deoarece un singur acces poate dura sute de cicluri Pentru un programator inventiv, GPU-ul Fermi poate fi una dintre cele mai puternice platforme de calcul Doar un singur GPU GTX bazat pe Fermi care rulează la MHz cu nuclee CUDA este capabil să ofere până la , teraflopi de performanță la coprocesoare ok consum de putere de W Statisticile devin și mai impresionante dacă ai în vedere că prețul mediu al GTX este sub USD Spre comparație: în anii , cel mai rapid computer Cry- din lume avea o performanță de , teraflopi la un preț de de milioane de dolari Totuși, a ocupat o cameră de dimensiuni medii și a avut nevoie de un sistem de răcire cu lichid pentru a devia kW de energie consumată GTX oferă performanță de de ori mai mare, costă de de ori mai puțin și consumă de de ori mai puțină energie De acord, e bine? Orez Ierarhia memoriei GPU Fermi Procesoare cripto Securitatea, și în special securitatea rețelei, este un alt domeniu (deja al treilea) în care coprocesoarele sunt utilizate pe scară largă Când se stabilește o conexiune între un client și un server, acestea necesită de obicei autentificare reciprocă Folosind o conexiune sigură (criptată) stabilită în acest fel, puteți transfera date în siguranță și nu vă gândiți la intrușii care trec prin linie Problema aici este că securitatea este asigurată prin intermediul criptografiei, iar această zonă necesită calcule foarte voluminoase În criptografie, două abordări principale ale protecției datelor sunt acum comune: criptarea cheii simetrice și criptarea cheii publice Primul se bazează pe o amestecare foarte minuțioasă a biților (de parcă aș pune mesajul i într-un fel de mixer electronic) A doua abordare se bazează pe multiplicarea și exponențiarea numerelor mari ( de biți), ceea ce necesită costuri de timp extrem de mari Multe companii au lansat coprocesoare criptografice, dar permit ca datele să fie criptate pentru transmisie sigură și apoi decriptate Adesea sunt carduri de expansiune care sunt introduse la conectorul PCI Datorită hardware-ului special, aceste procesoare pot efectua calculele criptografice necesare mult mai rapid decât unitatea centrală de procesare Din păcate, un studiu mai detaliat al procesoarelor criptografice ar necesita mult timp pentru criptografia în sine, ceea ce depășește scopul acestei cărți Informații suplimentare despre criptoprocesoare pot fi găsite în [Gaspar et al , ; Haghighizadeh et al , ; Shoufan și colab , ] Multiprocesoare Ne-am dat seama cum să introducem paralelismul într-un sistem uniprocesor prin adăugarea unui coprocesor la acesta Următorul pas este să combinați mai multe procesoare cu drepturi depline într-un singur sistem mare Astfel de sisteme cu procesoare multiple pot fi împărțite în multiprocesoare și multicalculatoare După ce am înțeles mai întâi sensul acestor termeni, vom studia multiprocesoarele, iar după ele - multicomputerele Multiprocesoare și multicalculatoare În orice sistem computerizat paralel, procesoarele care efectuează diferite părți ale unei singure sarcini trebuie cumva să interacționeze între ele pentru a face schimb de informații Cum ar trebui să aibă loc mai exact schimbul? Pentru aceasta, au fost propuse și implementate două strategii: multiprocesoare și multicalculatoare Diferența cheie dintre strategii este prezența sau absența memoriei partajate Această diferență afectează atât proiectarea, proiectarea și programarea unor astfel de sisteme, cât și costul și dimensiunea acestora Multiprocesoare Un computer paralel în care toate procesoarele au o memorie fizică comună se numește multiprocesor sau sistem de memorie partajată (Figura a) Toate procesele care lucrează împreună într-un multiprocesor pot avea un singur spațiu de adrese virtuale mapat la o memorie partajată Orice proces care utilizează comenzile de încărcare și stocare poate citi un cuvânt din memorie sau poate scrie un cuvânt în memorie Nimic altceva nu este necesar Două procese au capacitatea de a schimba cu ușurință informații - pentru aceasta, unul dintre ele pur și simplu scrie date în memoria partajată, iar celălalt le citește Datorită posibilității de interacțiune între două sau mai multe procese, multiprocesoarele sunt foarte populare Acest model este de înțeles programatorilor și permite rezolvarea unei game largi de probleme De exemplu, luați în considerare un program care analizează un bitmap și listează toate obiectele sale O copie a imaginii este stocată în memorie, așa cum se arată în Fig b Fiecare dintre cele procesoare rulează un proces, conceput pentru a analiza una dintre cele secțiuni Dacă un proces detectează că unul dintre obiectele sale traversează granița unei secțiuni, acel proces pur și simplu urmărește obiectul în secțiunea următoare, citind cuvintele din acea secțiune În exemplul nostru, unele obiecte sunt procesate prin mai multe procese, așa că va fi necesară o anumită coordonare la sfârșit pentru a determina numărul de case, copaci și avioane a b Orez Multiprocesor cu procesoare care partajează memorie (a); imagine împărțită în secțiuni, fiecare dintre ele analizată de un procesor separat (b) Deoarece toate procesoarele dintr-un multiprocesor folosesc același spațiu de adrese, rulează o singură copie a sistemului de operare În consecință, există o singură hartă a paginii de memorie și un tabel de proces Când un proces se blochează, procesorul său își salvează starea în tabelele sistemului de operare și apoi caută în acele tabele un alt proces pentru a rula Această organizație, care se bazează pe un singur sistem, distinge un multiprocesor de un multicomputer, în care fiecare computer are propria copie a sistemului de operare Multiprocesorul, ca toate computerele, trebuie să conțină dispozitive de intrare și ieșire (discuri, adaptoare de rețea etc ) În unele sisteme multiprocesor, doar anumite procesoare au acces la dispozitivele I/O și, prin urmare, au facilități speciale de I/O Pe alte sisteme multiprocesor, fiecare procesor poate accesa orice dispozitiv I/O Dacă toate procesoarele au acces egal la toate modulele de memorie și la toate dispozitivele I/O și este posibilă interschimbabilitatea completă între procesoare, un astfel de multiprocesor se numește simetric (Symmetric MultiProcessor, SMP) Multicalculatoare În a doua variantă a arhitecturii paralele, fiecare procesor are propria sa memorie disponibilă doar acestui procesor O astfel de schemă se numește multicomputer sau sistem de memorie distribuită (Fig , a) Diferența cheie dintre un multicomputer și un multiprocesor este că fiecare procesor dintr-un multicomputer are propria sa memorie locală, la care acest procesor o poate accesa executând Comenzi LOAD și STORE, dar niciun alt procesor nu poate accesa memoria locală a procesorului folosind aceste instrucțiuni Astfel, multiprocesoarele au un spațiu de adrese fizice partajat de toate procesoarele, în timp ce multicalculatoarele au spații de adrese fizice separate pentru fiecare procesor Deoarece procesoarele dintr-un multicomputer nu pot comunica între ele prin simple accese la memoria partajată, procesoarele fac schimb de M-R- -R-M - R - - R - a b Orez Multicomputer cu procesoare, fiecare cu memorie(i) proprie; bitmap al imaginii din fig împărțit între module de memorie (b) comunicare prin rețeaua de comunicații care le conectează Exemple de multicomputere includ IBM BlueGene/L, Red Storm și clusterul Google În absența memoriei partajate implementată în hardware, se presupune o anumită structură software Într-un multicomputer, este imposibil să existe un singur spațiu de adrese virtuale pentru toate procesoarele care să permită citirea și scrierea informațiilor cu comenzi LOAD și STORE De exemplu, dacă procesorul din colțul din stânga sus al Fig b (să dăm acestui procesor numărul ) constată că o parte din obiectul său se încadrează într-o altă secțiune legată de următorul procesor (să fie procesorul ), pur și simplu poate continua să citească informații din memorie pentru a obține o imagine a cozii aeronave Totuși, dacă procesorul din Fig , b, el nu va putea citi pur și simplu informații din memoria procesorului În acest caz, algoritmul de obținere a datelor trebuie să fie diferit În primul rând, procesorul trebuie să afle cumva care procesor conține datele de care are nevoie și să trimită un mesaj acelui procesor solicitând o copie a datelor Procesorul se blochează apoi până când este primit un răspuns Când procesorul primește un mesaj, acesta este analizat de software, după care datele solicitate sunt trimise înapoi Când procesorul primește un mesaj de răspuns, blocarea este eliberată de software și procesorul continuă să ruleze Într-un multicomputer, primitivele send și heeeee sunt adesea folosite pentru a comunica între procesoare Prin urmare, software-ul multicomputer are o structură mai complexă decât software-ul multiprocesor În acest caz, principala problemă este distribuirea corectă a datelor și plasarea lor rezonabilă Aceasta este o altă diferență între un multicomputer și un multiprocesor, unde plasarea datelor nu afectează corectitudinea soluționării problemei, deși poate afecta performanța Pe scurt, un multicomputer este mult mai greu de programat decât un multiprocesor Apare întrebarea: de ce să creați mai multe computere, dacă multiprocesoarele sunt mult mai ușor de programat? Răspunsul este simplu: construirea unui multicomputer mare este mai ușoară și mai ieftină decât construirea unui multiprocesor cu același număr de procesoare Implementarea unei memorie partajată partajată de câteva sute de procesoare este o provocare, dar proiectarea unui multicomputer cu sau mai multe procesoare este destul de ușoară Mai târziu, în acest capitol, ne vom uita la un multicomputer cu mai mult de de procesoare Astfel, ne confruntăm cu o dilemă: multiprocesoarele sunt greu de dezvoltat, dar ușor de programat, iar multicalculatoarele sunt ușor de construit, dar greu de programat Ca urmare, se încearcă în mod constant crearea de sisteme hibride Aceste încercări au condus la realizarea faptului că memoria partajată poate fi implementată în moduri diferite, iar fiecare variantă va avea avantaje și dezavantaje Aproape toate cercetările din domeniul arhitecturilor de computere paralele vizează crearea de forme hibride care să combină avantajele ambelor sisteme Aici este important să se realizeze scalabilitate, adică să se dezvolte un sistem care va continua să funcționeze corect atunci când se adaugă tot mai multe procesoare noi Una dintre abordări se bazează pe faptul că sistemele informatice moderne nu sunt monolitice, ci au o structură pe mai multe niveluri Acest lucru face posibilă implementarea memoriei partajate pe oricare dintre mai multe niveluri, așa cum se arată în n; orez Pe fig , și vedem memoria partajată implementată de aparatul io, ca într-un multiprocesor „adevărat” În această dezvoltare, există una; o copie a sistemului de operare cu un set de tabele, în special un tabel! alocare de memorie Dacă un proces are nevoie de mai multă memorie, acesta întrerupe sistemul de operare, care apoi caută în tabel o pagină liberă și mapează pagina respectivă la spațiul de adrese al procesului apelant În ceea ce privește sistemul de operare, există o singură memorie, iar sistemul de operare ține evidența ce pagină aparține cărui proces Există multe modalități de implementare a memoriei partajate în hardware A doua abordare este utilizarea hardware-ului multicomputer și a unui sistem de operare care va simula memoria partajată, oferind un singur spațiu de adrese virtuale paginat Cu această abordare, se obține o memorie distribuită distribuită (Distributed Shared Meinor DSM), în care fiecare pagină este amplasată într-unul dintre modulele de memorie (vezi Fig , a), iar fiecare mașină conține propria sa memorie virtuală și propria pagină tabele [Li și Hudak, ] Dacă procesorul emite o instrucțiune LOAD sau STORE în timp ce accesează o pagină pe care nu o are, apare o excepție de sistem După aceea, sistemul de operare găsește pagina dorită și apelează procesorul corespunzător pentru a descărca pagina din memorie și a o trimite prin rețeaua internă de comunicații prin care procesoarele fac schimb de mesaje Când pagina ajunge în procesul de primire, este mapată în memorie și execuția comenzii întrerupte se reia În esență, sistemul de operare pur și simplu preia paginile lipsă nu de pe disc, ci din memorie În același timp, utilizatorul a creat; Dă impresia că aparatul are o singură memorie partajată Vom reveni la memoria partajată distribuită mai târziu în acest capitol A treia abordare este de a implementa memoria partajată în mod programatic într-un sistem de utilizator în timp real Cu această abordare, abstracția memoriei partajate Mașină Mașină Mașină Mașină Mașină Mașină Aplicație Aplicație Aplicație Aplicație Aplicație Sistem în timp real utilizator Sistem în timp real utilizator Sistem în timp real utilizator Sistem în timp real utilizator Sistem în timp real utilizator Sistem în timp real utilizator Opera- Opera- Opera- Opera- Opera- Opera- tional sistem sistem sistem sistem sistem sistem Aparatură- Aparatură- Aparatură- Aparatură- Aparatură- Aparatură- nee nee nee nee sigur - sigur - sigur - sigur - sigur - sigur - coborare coborare coborare coborare Memoria comună Memoria comună Memoria comună A în Orez Niveluri la care poate fi implementată memoria partajată: implementare hardware (a); sistemul de operare (b); implementarea software (c) creează limbajul de programare, iar această abstractizare este implementată de compilator (adică, modelul de memorie partajată poate depinde de limbajul de programare utilizat) De exemplu, modelul Linda se bazează pe abstractizarea unui spațiu comun de tupluri (înregistrări de date care conțin seturi de câmpuri) Procesele de pe orice mașină pot lua un tuplu din spațiul partajat sau îl pot trimite în spațiul partajat Deoarece accesul la acest spațiu este controlat complet de software (sistemul în timp real Linda), nu este necesar nici un suport hardware special sau un sistem de operare special Un alt exemplu de memorie partajată implementat de un sistem personalizat în timp real este Modelul obiectelor de date partajate în sistemul Orcs În modelul Ogsa, procesele nu împărtășesc tupluri, ca în Linda, ci obiecte de bază apelând metode pe ele Dacă o metodă modifică starea internă a unui obiect, sistemul în timp real trebuie să se asigure că toate copiile acelui obiect de pe toate mașinile sunt modificate în același timp Din nou, deoarece obiectele sunt un concept pur software, ele pot fi implementate folosind un sistem în timp real fără intervenția sistemului de operare sau a hardware-ului Vom reveni la modelele Linda și Ogs mai târziu în acest capitol Clasificarea sistemelor informatice paralele Se pot spune multe despre software-ul pentru sistemele de calcul paralele, dar acum trebuie să revenim la subiectul principal al acesteia Capitole - arhitectura unor astfel de sisteme În ultimii ani, au fost propuse și construite multe tipuri de sisteme de calcul paralele, așa că aș dori să le clasific cumva Mulți cercetători au încercat să facă acest lucru cu rezultate diferite [Flynn, ; Treleaven, ], dar, din păcate, încă nu există o clasificare bună Clasificarea lui Flynn este folosită cel mai des, dar chiar și ea este în cel mai bun caz foarte aproximativă (Tabelul ) Tabelul Clasificarea lui Flynn a sistemelor computerizate paralele Fluxuri de comandă Fluxuri de date Exemple de categorii SISD Mașină clasică von Neumann lot SIMD Vector supercalculator, procesor matrice Multe MISD Nu există Multe Multe MIMD Multiprocesor, multicomputer Clasificarea lui Flynn se bazează pe conceptele de fluxuri de comandă și fluxuri de date Fluxul de instrucțiuni corespunde contorului de instrucțiuni Un sistem cu n procesoare are n contoare de programe și, prin urmare, n fluxuri de instrucțiuni Fluxul de date este format dintr-un set de operanzi De exemplu, într-un sistem de prognoză meteo, fiecare dintre mai mulți senzori poate furniza un flux de valori ale temperaturii măsurate la intervale regulate Fluxurile de comandă și de date sunt oarecum independente, deci există combinații de astfel de fluxuri (vezi Tabelul ) SISD (Single Instruction stream Single Data stream - un flux de instrucțiuni cu un flux de date) este arhitectura clasică a computerelor seriale von Neumann Un computer von Neumann are un flux de instrucțiuni și un flux de date și poate efectua o singură acțiune la un moment dat O mașină SIMD (Single Instruction-stream Multiple Data-stream) are o unitate de control care emite o instrucțiune la un moment dat, dar există mai multe ALU-uri care pot procesa mai multe seturi de date în același timp Prototipul mașinilor SIMD este procesorul ILLIAC IV (vezi Figura ) Deși aparatele SIMD nu sunt utilizate pe scară largă, unele computere convenționale folosesc instrucțiuni SIMD pentru a procesa date multimedia Instrucțiunile SSE din procesoarele Pentium sunt clasificate ca instrucțiuni SIMD În orice caz, există un domeniu în care ideile culese din „lumea SIMD” ies în prim-plan, și anume procesoarele de flux Procesoarele de flux sunt proiectate special pentru procesarea multimedia și pot juca un rol important în viitor [Kapasi et al , ] MISD (Multiple Instruction-stream Single Data-stream - mai multe fluxuri de instrucțiuni cu un singur flux de date) este o categorie destul de ciudată Aici, mai multe comenzi operează pe același set de date Este dificil de spus dacă există astfel de mașini, deși unii cataloghează mașinile cu transportoare drept MISD Ultima categorie este MIMD (Multiple Instruction-stream Multiple Data-stream - fluxuri de instrucțiuni multiple cu fluxuri de date multiple) Aici, mai multe procesoare independente funcționează ca parte a unui sistem mai mare Majoritatea procesoarelor paralele se încadrează în această categorie Atât multiprocesoarele, cât și multicalculatoarele sunt mașini MIMD Am extins clasificarea lui Flynn (Figura ) Categoria mașinilor SlMD este împărțită în două subgrupe Primul subgrup include numeroase supercalculatoare și alte mașini care funcționează pe vectori, efectuând aceeași operație pe fiecare element al vectorului Al doilea subgrup include mașini de tip ILLIAC IV, în care unitatea principală de control trimite comenzi către mai multe ALU independente Memoria comună Schimb de mesaje Orez Clasificarea calculatoarelor paralele În clasificarea noastră, categoria MIMD s-a împărțit în multiprocesoare (mașini cu memorie partajată) și multicalculatoare (mașini de mesagerie) Există trei tipuri de multiprocesoare Ele diferă unele de altele prin mecanismul de acces la memoria partajată și se numesc UMA (Uniform Memory ccess - uniform memory access), NUMA (NonUniform Memory Access - ^ homogeneous memory access) și COMA (Cache Only Memory Access - Elco access to cache) memorie) Această subcategorizare are sens, deoarece memoria este de obicei împărțită în mai multe module în multiprocesoare mari În mașinile UMA, fiecare procesor are același timp de acces la orice modul de memorie Cu alte cuvinte, fiecare cuvânt este citit din memorie cu aceeași viteză ca orice alt cuvânt Dacă acest lucru nu este posibil din punct de vedere tehnic, cele mai rapide accesări sunt încetinite pentru a se potrivi cu cele mai lente, astfel încât programatorul nu va observa nicio diferență Iată ce înseamnă „omogen” > stupa Această uniformitate face performanța previzibilă, iar acest factor este foarte important pentru crearea de programe eficiente O mașină NUMA, pe de altă parte, nu are proprietatea de uniformitate De obicei, fiecare procesor are unul dintre modulele de memorie care este situat mai jos decât celelalte, astfel încât accesul la acest modul de memorie are loc mult sus mai repede decât alții În acest caz, din punctul de vedere al producătorului, este foarte important unde ajung programul și datele Accesul la aparatele SOMA se dovedește, de asemenea, a fi eterogen, dar dintr-un motiv diferit Ne vom uita la fiecare dintre opțiuni mai detaliat mai târziu, când vom studia subcategoriile corespunzătoare A doua categorie principală de mașini MIMD este multicalculatoare, care, spre deosebire de multiprocesoare, nu au memorie partajată la nivel arhitectural Cu alte cuvinte, sistemul de operare al unui procesor dintr-un multicomputer nu poate accesa memoria altui procesor prin simpla lansare a unei comenzi LOAD Procesorul va trebui să trimită un mesaj și să aștepte un răspuns Este capacitatea sistemului de operare de a citi un cuvânt dintr-un modul de memorie de la distanță folosind instrucțiunea LOAD care distinge multiprocesoarele de multicomputere După cum am observat deja, deși chiar și într-un multicomputer programele de utilizator pot accesa alte module de memorie folosind comenzile LOAD și STORE, această capacitate nu este suportată de hardware, sistemul de operare creează iluzia Diferența este minoră, dar foarte importantă Deoarece multicomputerele nu au acces direct la modulele de memorie la distanță, acestea sunt uneori clasificate ca NORMA (NO Remote Memory Access - fără acces la memorie la distanță) Multicalculatoarele pot fi, de asemenea, împărțite în două categorii suplimentare Categoria MPP (Massively Parallel Processor) include supercalculatoare scumpe care constau dintr-un număr mare de procesoare conectate printr-o rețea de comunicații internă de mare viteză Un exemplu comercial binecunoscut este supercalculatorul IBM SP/ A doua categorie de multicalculatoare include computerele personale convenționale sau stațiile de lucru (uneori montate în rafturi) care comunică conform unor tehnologii de comunicații comerciale Din punct de vedere logic, nu există nicio diferență fundamentală aici, dar un supercomputer puternic în valoare de milioane de dolari este cu siguranță folosit diferit decât o rețea de calculatoare asamblată de utilizatorii finali, care este de multe ori mai ieftină decât orice mașină MPP Aceste sisteme „de origine” sunt uneori numite rețele de stații de lucru (Network Of Workstations, NOW), clustere de stații de lucru (Cluster Of Workstattions, COW) sau pur și simplu clustere (cluster) Semantica memoriei Deși toate multiprocesoarele oferă procesoarelor o imagine a unui spațiu comun de adresă unică, adesea există multe module de memorie împreună cu acesta, fiecare dintre ele stochează o parte din memorie fizică Procesoarele și modulele de memorie sunt conectate printr-o rețea de comunicații complexă (consultați secțiunea „In-Processor Multithreading” din acest capitol de mai sus) Mai multe procesoare pot încerca să citească un cuvânt din memorie în același timp în care alți procesoare încearcă să-l scrie; este posibil ca mesajele să nu fie livrate în ordinea în care au fost trimise La aceste probleme se adaugă existența mai multor copii ale unor fragmente de memorie (de exemplu, în memoria cache), și ca urmare vom ajunge în haos dacă nu luăm contramăsuri serioase În această subsecțiune, vom afla ce este de fapt body este memorie partajată și modul în care modulele de memorie pot fi utilizate cu înțelepciune în astfel de circumstanțe Semantica memoriei poate fi gândită ca un contract între software-ul de memorie și hardware [Adve și Hill, ] Dacă software-ul este de acord să respecte anumite reguli, atunci memoria este de acord să producă anumite rezultate Principala problemă aici sunt regulile în sine, care se numesc modele de consistență Multe astfel de reguli au fost propuse și dezvoltate [Sorin et al , ] Pentru a vă face o idee despre problemă, să presupunem că procesorul scrie valoarea într-un cuvânt de memorie, iar puțin mai târziu procesorul scrie valoarea în același cuvânt Procesorul citește acest cuvânt și primește valoarea Ar trebui atunci proprietarul computerului să contacteze biroul de reparații? Depinde de ceea ce este promis în contract Solvabilitate strictă Cel mai simplu model este modelul de consistență strictă Într-un astfel de model, orice citire de la adresa x returnează întotdeauna valoarea celei mai recente intrări din x Programatorilor le place foarte mult acest model, dar poate fi pus în practică doar în felul următor: ar trebui să existe un singur modul de memorie care să servească pur și simplu toate cererile pe măsură ce intră (primul intrat, primul ieșit), stocarea în cache și duplicarea datelor nu sunt permis Din păcate, această abordare ar încetini semnificativ memoria, așa că cu greu poate fi considerată o propunere serioasă Consistență secvențială În continuare, luăm în considerare modelul de consistență secvențială [Lamport, ] Conform acestui model, atunci când există multiple cereri de citire și scriere, ordinea de procesare a cererii este determinată de hardware, dar toți procesoarele percep aceeași ordine Luați în considerare un exemplu Să presupunem că procesorul scrie valoarea în cuvântul x, iar după ns procesorul scrie acolo valoarea Acum să presupunem că la ns după începerea celei de-a doua operațiuni de scriere (procesul de scriere nu s-a încheiat încă), alte două procesoare, și , citiți cuvântul x de două ori (Fig ) Procesor Scrieți valoarea Intrarea a doua Valori de citire de " Orez Două procesoare scriu, iar celelalte două procesoare citesc același cuvânt din memoria partajată Opțiunile posibile pentru secvența a șase evenimente sunt prezentate în tabel multiprocesoare Tabelul Opțiuni posibile pentru succesiunea evenimentelor conform Fig Opțiunea Opțiunea Opțiunea Scrieți valoarea Scrieți valoarea Scrieți valoarea Scrieți valoarea Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesor Scrieți valoarea Scrieți valoarea Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesorul Citiți valoarea de către procesorul În primul caz, ambele procesoare primesc valoarea în fiecare dintre cele două operații de citire În a doua opțiune, procesorul primește valorile și , iar procesorul primește de ambele ori În a treia opțiune, procesorul primește de două ori , iar procesorul primește valorile și Toate aceste opțiuni sunt valabile, precum și altele, care nu sunt afișate aici Nu există un sens „un singur drept” Memoria construită după modelul de consistență secvențială nu ar permite niciodată procesorului să obțină valorile și dacă procesorul ar primi valorile și Dacă acest lucru s-ar întâmpla, din punctul de vedere al procesorului , aceasta ar însemna că procesorul a scris valoarea finalizată înainte ca procesorul să scrie valoarea Acest lucru este complet posibil Dar din punctul de vedere al procesorului , aceasta înseamnă și că scrierea procesorului de s-a încheiat înainte de scrierea procesorului de Prin el însuși, acest rezultat este posibil, dar contrazice primul rezultat Consistența secvențială garantează o singură secvență globală (percepută de toate procesoarele) de operații de scriere Daca din punctul de vedere al procesorului se scrie prima valoarea , procesorul ar trebui sa "vada" la fel Deși regulile de consistență secvențială nu arată la fel de „greu” ca cele stricte, acest model este și el foarte util Chiar dacă mai multe evenimente au loc în același timp, se consideră că ele apar de fapt într-o anumită ordine (care poate fi aleasă în mod arbitrar), iar toți procesatorii percep această ordine Deși această stare de fapt pare evidentă, în cele ce urmează vom avea în vedere câteva modele de consistență care nu garantează o astfel de comandă Viabilitatea procesorului Consistența procesorului nu este un model foarte strict, dar este mai ușor de implementat pe multiprocesoare mari [Goodman, ] Are două proprietăți Toate procesoarele văd operațiile de scriere ale oricărui procesor în ordinea în care sunt efectuate aceste operațiuni Toate procesoarele văd toate scrierile pe orice cuvânt de memorie în aceeași ordine ww** !/!«■« despre arhitecturi paralele de calculatoare Ambele puncte sunt foarte importante Punctul nervos spune că dacă procesorul începe să scrie valorile IA, B și C într-un loc din memorie, în această ordine, atunci toți ceilalți procesoare vor vedea aceste înregistrări în aceeași ordine Cu alte cuvinte, nu se va întâmpla niciodată ca vreun procesor să vadă mai întâi valoarea B și apoi valoarea IA Al doilea punct este să vă asigurați că fiecare cuvânt din memorie are o semnificație definită și neechivocă după ce procesorul a făcut mai multe scrieri pe acel cuvânt și apoi s-a oprit Toată lumea ar trebui să vadă aceeași ultima valoare Chiar și cu astfel de limitări, dezvoltatorul are o mulțime de opțiuni Să vedem ce se întâmplă dacă procesorul începe trei scrieri ale A, B și C în același timp cu cele trei scrieri ale procesorului Alte procesoare care sunt ocupate să citească cuvinte din memorie vor vedea o secvență de șase scrieri, cum ar fi IA, B , A, B, C, C sau A, IA, B, C, B, C etc Cu consistența procesorului, nu este garantat că fiecare procesor va vedea aceeași ordine (spre deosebire de consistența secvențială) Este posibil ca unii procesoare să perceapă ordinea IA, B, A, B, IC, C, alții - A, IA, B, C, B, C și încă alții - o altă opțiune Singurul lucru care este absolut garantat este că niciun procesor nu va vedea secvența în care operația B este efectuată mai întâi și apoi IA Ordinea în care sunt executate accesările la același procesor rămâne aceeași pentru toți observatorii Trebuie remarcat faptul că unii autori definesc în mod diferit consistența procesorului și nu necesită ca a doua condiție să fie îndeplinită Solvabilitate slabă În modelul de consistență slabă, nu este garantat că operațiunile de scriere efectuate de un procesor vor fi acceptate de alții în aceeași ordine [Dubois et al , ] Un procesor poate vedea mai întâi operațiunea IA, apoi B, celălalt - mai întâi B, apoi IA Pentru a aduce ordine în acest haos, trebuie să existe variabile de sincronizare a memoriei sau o operație de sincronizare a memoriei suportată Sincronizare Prgt toate operațiunile de scriere în așteptare sunt finalizate și nicio operațiune nouă nu poate începe până când toate scrierile anterioare nu au fost finalizate și sincronizarea în sine sa încheiat Sincronizarea aduce memoria într-o stare stabilă în care nu există operațiuni în așteptare Operațiile de sincronizare în sine sunt consistente secvenţial, adică dacă sunt inițiate de mai mulți procesoare, se alege o anumită ordine pentru a le executa, iar toți procesoarele percep aceeași ordine Cu o consistență slabă, timpul este împărțit în perioade strict consecutive separate prin operații de sincronizare (Fig ) Nu este garantată o comandă specială pentru operațiunile de scriere IA și B, iar procesoarele diferite le pot percepe diferit, adică din punctul de vedere al unui procesor, operația IA poate fi efectuată mai întâi, apoi B și din punctul de vedere al vedere a altuia, mai întâi B și apoi IA Această situație este acceptabilă Cu toate acestea, pentru toate procesoarele, operațiunea B a fost finalizată înainte de C, deoarece înregistrările C, B, A, B au putut începe numai după ce înregistrările IA, B și A au fost finalizate în timpul primei operațiuni de sincronizare Astfel, cu ajutorul operațiunilor de sincronizare este posibil să se introducă în mod programatic o anumită ordine în secvența evenimentelor, deși acest lucru durează ceva timp, deoarece necesită curățarea conductei de memorie Efectuarea prea des a unor astfel de operațiuni va crea probleme Înregistrare Procesorul A D E Procesorul B A B D Procesorul C PENTRU ST AP Momentul de sincronizare Ora -► Orez Operațiile de sincronizare sunt efectuate periodic pe o memorie slab consistentă Solvabilitate liberă Consistența slabă nu este un model foarte eficient, deoarece necesită finalizarea tuturor operațiunilor de memorie și întârzie noile operațiuni până la finalizarea celor anterioare Modelul de consecvență liberă merge mult mai bine deoarece folosește ceva similar cu secțiunile critice* ale programului [Gharachorloo et al , ] Ideea este următoarea Dacă un proces iese în afara regiunii critice, aceasta nu înseamnă că toate scrierile ar trebui să se termine imediat Este necesar doar ca toate scrierile să fie finalizate înainte ca orice proces să intre din nou în această regiune critică În acest model, operația de sincronizare este separată în două operații diferite Pentru a citi sau a scrie într-o variabilă partajată, procesorul (adică, software-ul său) trebuie mai întâi să efectueze o operație de achiziție asupra variabilei de sincronizare, ceea ce îi permite să obțină acces exclusiv la datele partajate Procesorul poate apoi să facă orice dorește să facă cu datele (citește sau scrie), iar când este gata, trebuie să emită o operație de eliberare a variabilei de sincronizare pentru a indica faptul că s-a terminat Operația de eliberare nu necesită finalizarea scrierilor în așteptare, dar nu se poate finaliza singură până când toate scrierile începute anterior nu se vor finaliza Mai mult, operațiunile noi de memorie pot începe imediat Când începe următoarea operațiune de achiziție, se face o verificare pentru a vedea dacă toate operațiunile de eliberare anterioare s-au încheiat Dacă nu, atunci operația de achiziție este întârziată până când este finalizată (și toate operațiunile de scriere trebuie finalizate înainte ca toate operațiunile de eliberare să se fi încheiat) Astfel, dacă următoarea achiziție are loc suficient de mult după ultima lansare, nu trebuie să aștepte și poate intra în regiunea critică fără întârziere Dacă operația de achiziție este executată la scurt timp după operația de eliberare, op (și toate comenzile care trebuie executate după) așteaptă toate il "oa o paralel operațiuni de eliberare Acest lucru asigură că toate variabilele din regiunea critică sunt actualizate Acest model este ceva mai complex decât modelul de consecvență slabă, dar are un avantaj semnificativ: nu trebuie să întârzie execuția comenzilor la fel de des ca în modelul de consecvență slabă Problema viabilității memoriei nu poate fi considerată definitiv rezolvată Cercetătorii încă mai propun noi modele [Naeem et al , ; Sorin și colab , ; Tu et al , ] Multiprocesoare UMA în arhitecturi multiprocesoare simetrice Cele mai simple multiprocesoare au o singură magistrală (Fig , a) Două sau mai multe procesoare și unul sau mai multe module de memorie folosesc această magistrală pentru a comunica Dacă procesorul trebuie să citească un cuvânt din memorie, mai întâi verifică dacă magistrala este liberă Dacă magistrala este liberă, procesorul plasează pe magistrală adresa cuvântului dorit, afirmă câteva semnale de control și așteaptă ca memoria să plaseze cuvântul solicitat pe magistrală Memoria comună Obosi a b Memorie proprie în Orez Trei variante de multiprocesor pe o singură magistrală: fără cache (a); cu memorie cache (b); cu memorie cache și module separate de memorie locală (c) Dacă magistrala este ocupată, procesorul așteaptă pur și simplu ca acesta să devină liber Există o problemă cu această schemă Cu două sau trei procesoare, accesul la magistrală nu este greu de reglat, dificultăți apar atunci când există procesoare sau Performanța sistemului în acest caz este complet determinată de lățimea de bandă a magistralei și multe procesoare trebuie să rămână inactiv de cele mai multe ori Pentru a rezolva problema, trebuie să adăugați memorie cache la fiecare procesor, așa cum se arată în Fig b Memoria cache poate fi amplasată în interiorul cipului procesorului, lângă cipul procesorului, pe placa procesorului /Orice combinație a acestor opțiuni este permisă Deoarece din memoria cache pot fi citite multe cuvinte în acest caz, traficul pe autobuz va scădea și sistemul va putea deservi mai multe procesoare Astfel, memorarea în cache are un efect semnificativ în acest caz Cu toate acestea, după cum vom vedea în curând, reconcilierea conținutului cache-urilor este departe de a fi o sarcină banală În schema următoare, fiecare procesor are nu numai un cache, ci și propria sa memorie locală, pe care o accesează printr-o magistrală locală dedicată (Fig , c) Pentru a face o utilizare optimă a acestei configurații, compilatorul trebuie să plaseze tot codul programului, șirurile de caractere, constantele și alte date de numai citire, precum și stivele și variabilele locale, în unitățile de memorie locale Memoria partajată va fi necesară doar pentru stocarea variabilelor partajate În cele mai multe cazuri, această alocare sensibilă reduce semnificativ traficul pe autobuz • Arhitectura ""iw/upsmѵ tsuMjiBiutrmyv Cache L Nord i Top eu Specializat ► cip vest* I f Ch О Bariera colectivă reţea port ethernet Gbps Fund Orez Microprocesor specializat în sistemul BlueGene/P în cache-urile altor procesoare Un acces la memorie care provoacă o pierdere a cache-ului de primul nivel și o accesare a cache-ului de la al doilea nivel durează cicluri pentru procesare Cu o pierdere de cache la al doilea nivel, o lovitură de cache la al treilea nivel este deja procesată timp de de cicluri În cele din urmă, în cazul unei pierderi de cache la al treilea nivel, trebuie accesată memoria principală (DDR SDRAM), ceea ce durează aproximativ de cicluri Cele patru procesoare sunt conectate printr-o magistrală de înaltă performanță într-o rețea cu topologie „ D torus”, necesitând șase conexiuni: sus, jos, nord, vest, sud și est În plus, fiecare procesor este conectat printr-un port la o rețea partajată folosită pentru a distribui date între procesoare Portul de barieră accelerează operațiunile de sincronizare, oferind fiecărui procesor acces rapid la o rețea de ceas dedicată Pentru un nivel superior, IBM a dezvoltat o placă specializată pe care unul dintre microcircuitele prezentate în Fig precum și GB RAM DDR Microcircuitul este prezentat în , iar placa este prezentată în fig , b Plăcile sunt montate pe un panou încastrat, de plăci pe panou, ceea ce oferă de cipuri (adică de procesoare) pe panou Deoarece fiecare placă are GB de DRAM, placa are un total de GB de memorie (Fig , c) La nivelul următor, , astfel de panouri sunt introduse în rack, rezultând procesoare în rack Raftul este prezentat în fig ora Chip procesoare Cache L MB A plati cip procesoare GB Panou Raft de cărți de jetoane de procesoare GB panouri plăci cipuri procesoare Sistem de rafturi panouri placi procesoare TB TB A G d în Orez BlueGene/P: cip (a), placă (b), panou (a), rack (d), sistem (e) În cele din urmă, întregul sistem, format din de rack-uri cu procesoare, este prezentat în Fig , e PowerPC procesează până la instrucțiuni/ciclu; Astfel, un sistem complet BlueGene/P poate procesa teoretic până la de instrucțiuni pe ciclu La o frecvență de MHz, performanța teoretică a sistemului ajunge la petaflopi/s Cu toate acestea, din cauza conflictelor de date, zads | memorie și paralelism insuficient, performanța reală este redusă semnificativ Când rulați programe reale pe BlueGene/, a fost atinsă o performanță de aproximativ petaflop/s Sistemul este un multicomputer în sensul că niciunul dintre procesoare nu are acces direct la memorie, cu excepția celor GB de memorie nativă de pe placă Nicio pereche de procesoare nu are memorie partajată De asemenea, apelarea paginilor la cerere nu este acceptată deoarece nu există discuri locale care să găzduiască paginile În schimb, există de noduri I/O în sistem care se conectează la discuri și alte periferice În ciuda dimensiunii excepționale a sistemului, acesta este destul de simplu și nu folosește nicio tehnologie specială, cu excepția plasării nodurilor extrem de dense Nu este o coincidență, deoarece obiectivele principale erau fiabilitatea și disponibilitatea În consecință, sistemele de alimentare cu energie, sistemele de răcire, sistemele de cabluri etc , au fost proiectate foarte atent, iar acest lucru a făcut posibilă creșterea timpului mediu dintre defecțiuni la zile Conectarea tuturor cipurilor necesită o interconectare scalabilă și de înaltă performanță Trei ms | un torus cu dimensiunea de x x Astfel, fiecare microcircuit necesită linii de comunicație: pentru vecinii amplasați logic deasupra și dedesubt, pentru vecinii din nord și sud, pentru vecinii din vest și est (vezi corespunzătoare ! "lam o arhitecturi paralele de calculatoare denumirile din fig ) Din punct de vedere structural, fiecare rafturi pentru noduri formează un torus de x x O pereche de rafturi adiacente sunt conectate la un tor de x x Patru perechi de rafturi de pe un rând formează un torus de x x și, în cele din urmă, toate cele rânduri dau un torus care măsoară x x Astfel, toate conexiunile sunt punct la punct și funcționează la , Gbps Deoarece există trei legături de la fiecare dintre cele de noduri către nodurile „următoare în ordine”, câte una pentru fiecare dimensiune, debitul total al sistemului este de Tbps Capacitatea de informații a cărții pe care o țineți în mâini, inclusiv desenele PostScript încapsulate, este de aproximativ de milioane de biți, astfel încât BlueGene / P poate transfera până la , milioane de copii ale acesteia într-o secundă Unde să puneți aceste copii și cine le-ar putea citi - lăsăm aceste întrebări cititorului Interacțiunea într-un torus D este susținută sub formă de rutare virtuală prin tăiere Această abordare este oarecum similară cu comutarea stocării și redirecționării pachetelor (a se vedea secțiunea Coprocesoare), cu excepția faptului că pachetele întregi nu sunt stocate înainte de redirecționarea ulterioară de-a lungul legăturii De îndată ce următorul octet al pachetului ajunge la nodul de tranzit, acesta este transmis mai departe de-a lungul rutei fără a aștepta primirea întregului pachet Sunt permise atât rutarea dinamică (adaptativă), cât și cea statică (fixă) Pentru a implementa rutarea virtuală end-to-end, există mai multe dispozitive specializate pe cip Pe lângă torul D principal care asigură comunicarea, există și alte rețele de comunicații A doua rețea (colectivă) are o structură arborescentă În sistemele cu un grad ridicat de paralelism, cum ar fi BlueGene/P, multe operațiuni necesită participarea tuturor nodurilor Ca exemplu, luați în considerare problema găsirii celei mai mici dintre de valori, fiecare dintre acestea fiind stocată într-un nod separat Dacă toate nodurile sunt conectate într-o structură arborescentă, fiecare două noduri își pot trimite valorile către nodul superior, care îl poate alege pe cel mai mic și îl poate trece mai sus Cu această abordare, doar minimul necesar de informații intră în nodul rădăcină (imaginați-vă dacă fiecare dintre cele de noduri ar transmite direct un mesaj către nodul rădăcină) A treia rețea (barieră) este utilizată pentru suspendări și întreruperi globale Unii algoritmi necesită execuție în etape, când fiecare nod, după ce și-a încheiat etapa, nu trece la următorul, ci așteaptă până când toți ceilalți termină aceeași etapă O rețea de barieră specială vă permite să setați în mod programatic aceste etape și să suspendați calculele pe toate procesoarele care și-au încheiat etapa înainte de restul Când toți procesoarele își termină etapa, calculul continuă Aceeași rețea de barieră este utilizată pentru întreruperi A patra și a cincea rețea utilizează tehnologia Ethernet de Gb Unul dintre ele conectează nodurile I/O la servere de fișiere non-BlueGene/P și la Internet; celălalt este folosit pentru a depana sistemul Fiecare nod de calcul și comunicații rulează un mic sistem de operare specializat care acceptă un utilizator și un proces Un proces poate avea până la patru fire de execuție de program, câte unul pentru fiecare procesor dintr-un nod Această structură simplă a fost aleasă pentru performanța și fiabilitatea sa ridicată Pentru a promova safe i, o aplicație poate crea un punct de salvare apelând o procedură de bibliotecă După ce rețeaua a terminat de transmis toate mesajele care nu au fost încă transmise, puteți crea un punct de salvare global, astfel încât, în cazul în care sistemul se blochează, lucrarea să poată fi pornită din acest punct și nu de la început Nodurile I/O rulează sistemul de operare tradițional Linux și acceptă multitasking Se lucrează la următoarea generație a sistemului BlueGene, numită BlueGene/Q Acest sistem este de așteptat să fie în producție în , va conține procesoare pe cip și va suporta, de asemenea, multithreading paralel Aceste două caracteristici vor crește foarte mult performanța sistemului în ceea ce privește instrucțiunile pe ciclu Se așteaptă ca sistemul să atingă de petaflopi/s Informații suplimentare despre BlueGene/L pot fi găsite în [Adigaetal, ; Alam şi colab , ; Almasi şi colab , a şi b; Blumrich şi colab , ; IBM, ] Furtuna Rosie Ca un al doilea exemplu de sisteme MPP, luați în considerare Furtuna Roșie a Laboratorului Național Sandia (numită și Ciocanul lui Thor) Laboratorul Sandia este operat de Lockheed Martin și efectuează misiuni clasificate și neclasificate pentru Departamentul de Energie al SUA Printre lucrările clasificate se numără simularea exploziilor nucleare, care necesită calcule foarte intense Sandia este în afaceri de mult timp și are de mulți ani cele mai puternice supercomputere Timp de zeci de ani, supercomputerul vectorial a fost preferat aici, dar la un moment dat, datorită dezvoltării tehnologiei și schimbărilor din economie, mașinile MPP au început să le înlocuiască Începând din , mașina MPP folosită atunci numită ASCI Red a început să „alunece” din ce în ce mai mult Deși avea de noduri, împreună ofereau doar , TB de RAM și , TB de spațiu pe disc, iar sistemul în ansamblu se lupta să mențină performanța de teraflon/s Așa că în , Sandia a decis să înlocuiască ASCI Red alegând Cray Research ca furnizor pe termen lung de supercalculatoare Noul sistem a fost livrat în august , ceea ce este foarte rapid pentru dezvoltarea și implementarea unei mașini atât de mari Motivul pentru această viteză este că multicomputerul Red Storm este construit aproape exclusiv din componente convenționale disponibile comercial Singura excepție este un cip specializat folosit pentru rutare În , sistemul a fost reechipat cu procesoare noi; această versiune este descrisă mai jos Pentru Red Storm a fost ales un procesor dual-core Opteron , GHz de la AMD Această alegere a fost determinată de câteva dintre caracteristicile sale cheie Primul este suportul pentru trei moduri de operare În modul vechi, programele obișnuite* Pentium pot rula pe acest procesor fără nicio modificare În modul de compatibilitate, sistemul de operare rulează ca un sistem de operare pe de biți și poate adresa până la de biți de memorie, în timp ce programele de aplicație sunt pe de biți În cele din urmă, în modul pe de biți, întreaga mașină devine pe de biți și poate adresa întreg spațiul de adrese de de biți Mai mult, în modul pe de biți, unul Ambele programe pe de biți și pe de biți pot rula temporar, facilitând actualizările de sistem O altă caracteristică cheie a Opteron este luarea în considerare atentă a lățimii de bandă a memoriei În ultimii ani, procesoarele au devenit din ce în ce mai rapide, depășind semnificativ memoria în această cursă Ca rezultat, în cazul unei pierderi de cache în memoria cache de al doilea nivel, timpul de acces la memorie crește semnificativ Inginerii AMD au instalat un controler de memorie în procesorul Opteron care rulează la frecvența procesorului în loc de frecvența magistralei de memorie, ceea ce îmbunătățește performanța memoriei Controlerul poate gestiona opt DIMM-uri de GB pentru un maxim de GB de memorie Sistemul Red Storm setează - GB pentru fiecare procesor Opteron, dar nu există nicio îndoială că în timp, pe măsură ce memoria devine mai ieftină, această valoare va crește O altă oportunitate de îmbunătățire a performanței sistemului este înlocuirea procesoarelor Opteron cu modele dual-core, care teoretic ar trebui să dubleze puterea de procesare Fiecărui procesor Opteron i se atribuie propriul procesor de rețea dedicat, numit IBM Seastar Acesta este un element critic al sistemului, deoarece aproape tot schimbul de informații între procesoare are loc prin intermediul rețelei Seastar Fără rețeaua de comunicații de mare viteză pe care o suportă aceste cipuri, sistemul s-ar îneca rapid în date Deși procesoarele Opteron sunt procesoare comune disponibile comercial, Red Storm le instalează pe propriile plăci dedicate (Figura ) Fiecare astfel de placă conține procesoare Opteron, Orez Plasarea componentelor Red Storm GB RAM, procesoare Seastar, procesor RAS (Reliability, Availability and Service), cip Ethernet de Mbps Un set de opt plăci este instalat în panou și introdus în casetă Fiecare rack are trei dintre aceste casete, permițându-vă să instalați de procesoare Opteron, precum și sursele de alimentare și sistemul de răcire necesare Întregul sistem este format din rack-uri, oferind de procesoare cu module de memorie SDRAM de TB Fiecare procesor are acces doar la propriul modul SDRAM, nu există memorie partajată Puterea teoretică de calcul a sistemului este de teraflops/s Procesoarele Opteron separate sunt interconectate folosind routere specializate Seastar, câte un router per CPU Ele sunt conectate între ele într-un tor tridimensional care măsoară x x , în fiecare nod din care există un router Fiecare router are linii de comunicație bidirecționale de mare viteză ( Gb/s) Șase dintre ele duc la vecini: nord, est, sud, vest, sus și jos, iar un altul conectează routerul la procesorul Opteron Timpul de transmisie între nodurile rețelei vecine este de µs Este nevoie de µs pentru a parcurge întregul set de noduri de calcul O altă rețea se bazează pe tehnologia Ethernet de Mbps și servește la deservirea și sprijinirea sistemului Pe lângă cele rafturi de calcul, sistemul are rafturi I/O și procesoare de service Fiecare dintre ele are de procesoare Opteron Dintre aceste procesoare, sunt responsabile pentru I/O și pentru întreținere Restul spațiului este ocupat de unități organizate pe nivelurile RAID și , fiecare cu o unitate de paritate și o unitate hot-swap Cantitatea totală de spațiu pe disc este de TB Debitul combinat al sistemului de discuri este de GB/s Sistemul, folosind întrerupătoare mecanice, este împărțit în două părți, secrete și non-secrete, care, dacă este necesar, pot fi separate Din numărul total de procesoare, sunt întotdeauna în secțiunea secretă, alți sunt întotdeauna în cea non-secretă Cele de procesoare de calcul rămase pot fi comutate între secțiuni, așa cum se arată în Fig Toate procesoarele Opteron din secțiunea secretă au GB memorie, toate celelalte au GB I/O și procesoarele de întreținere sunt împărțite între secțiuni Întregul sistem este găzduit într-o clădire separată de m , proiectată și construită pentru a extinde sistemul la de procesoare, dacă este necesar în viitor Consumul de energie al nodurilor de calcul este de , MW, discurile consumă încă MW Împreună cu sistemul de ventilație și aer condiționat, consumul total de energie este de , MW Hardware-ul și software-ul computerului au costat de milioane de dolari, clădirea și ventilația au costat alte milioane de dolari, pentru un total de puțin sub de milioane de dolari, deși o parte din acești bani sunt costuri unice de dezvoltare Adică, dacă vrei să obții o copie exactă, pregătește aproximativ de milioane de dolari În plus, Sgau se așteaptă să vândă versiuni reduse ale sistemului organizațiilor guvernamentale și private sub numele HZT I/O și nod de întreținere Intrerupator Nod de calcul TB stocare pe disc de rafturi secrete ( procesoare Opteron) de rafturi comutabile de rafturi neclasificate ( procesoare Opteron) TB stocare pe disc Orez Sistem Red Storm, vedere de sus Nodurile de calcul funcționează sub controlul unui nucleu ușor numit Catamount ("pisică sălbatică") Nodurile I/O sunt gestionate de sistemul de operare Linux obișnuit cu câteva completări pentru a sprijini interfața MPI (vezi mai târziu în acest capitol) Nodurile RAS rulează o versiune simplificată de Linux Pe Red Storm, puteți rula programe abundente pentru ASCI Red, printre care se numără programe de alocare a procesoarelor, planificatoare, biblioteci MPI, biblioteci de matematică, programe de aplicație Pentru un sistem atât de mare, problemele de fiabilitate vin în prim-plan Fiecare placă conține un procesor RAS conceput pentru a deservi sistemul, precum și hardware specializat Scopul dezvoltatorilor a fost realizarea unui MTBF (Meap Time Between Failures - Mean Time Between Failures) egal cu de ore Hardware-ul ASCI Red avea această cifră de de ore, dar sistemul de operare a distrus totul - o defecțiune completă a sistemului a avut loc la fiecare de ore Și deși noul hardware este mult mai fiabil decât vechiul, punctul slab este totuși software-ul Informații mai detaliate despre Red Storm pot fi găsite în [Brightwell et al , , ] Comparație între sistemele BlueGene/P și Red Storm Sistemele BlueGcne/L și Red Storm, fiind similare în multe privințe, au multe diferențe, așa că este destul de interesant să le comparăm între ele În tabel arată valorile unora dintre parametrii lor cheie Tabelul Comparație între sistemele BlueGene/ și Red Storm Parametrul BlueGene/L Red Storm CPU -bit PowerPC -bit Opteron Frecvență MHz , GHz Număr de procesoare de calcul Numărul de procesoare la bord Parametrul BlueGene/L Red Storm Numărul de procesoare pe rack Număr de rafturi de calcul Debit (teraflopi pe secundă) Memorie per procesor MB - GB Memorie totală TB TB Router PowerPC Seastar Număr de routere Topologie Dimensiune Tor x x Dimensiune Tor x x Rețele Gigabit Ethernet Fast Ethernet suplimentare Posibilitate de împărțire în secțiuni Nu Da OS pentru noduri de calcul Specializate Specializate I/O OS Linux Linux Producător: IBM Cray Research Cost ridicat ridicat Aceste două mașini au fost construite cam în același timp, așa că diferențele dintre ele sunt determinate nu de tehnologie, ci de înclinațiile dezvoltatorilor și, de asemenea, într-o oarecare măsură, de diferențele dintre IBM și Cray Sistemul BlueGene/P a fost conceput de la început ca un vehicul comercial de vânzare către companii biotehnologice, farmaceutice și alte companii În schimb, sistemul Red Storm a fost construit personalizat de Sandia Labs, iar Cray intenționează să ofere spre vânzare versiuni reduse ale sistemului Abordarea IBM este foarte simplă: să construiești un microcircuit, deși specializat, dar cu viteză redusă și ieftin în producția de masă, din nuclee existente, și apoi să combine un număr foarte mare de aceste microcircuite cu o rețea nu foarte mare O abordare diferită, dar la fel de înțeleasă a fost adoptată de Sandia: luați cel mai puternic procesor pe de biți de pe piață, echipați-l cu un router personalizat de mare viteză și mai multă memorie, rezultând noduri de calcul mult mai puternice decât nodurile BlueGene/P Astfel de noduri vor necesita mult mai puțin, prin urmare, schimbul de informații între ele va avea loc, respectiv, mai rapid Fiecare decizie a afectat plasarea elementelor într-un mod diferit Datorită faptului că IBM a dezvoltat un cip specializat care a combinat procesorul și routerul, a fost posibil să se obțină o densitate de ambalare mai mare - procesoare într-un rack La Sandia, fiecare nod a instalat un convențional procesor de masă și capacitate de memorie de GB, astfel încât doar de procesoare de calcul au putut fi plasate în rack Ca rezultat, Red Storm ocupă mai mult spațiu și consumă mai multă energie decât BlueGene/P În lumea exotică a laboratoarelor naționale de cercetare, performanța este cheia În acest parametru, BlueGene / P câștigă, deoarece performanța acestui sistem este de teraflopi / s față de teraflopi / s pentru Red Storm Dar nu trebuie să uităm că designul lui Red Storm este extensibil, așa că Sandia poate crește probabil performanța prin introducerea de procesoare Opteron suplimentare Cu toate acestea, IBM este capabil să răspundă la acest lucru prin creșterea ușoară a frecvenței de ceas (într-adevăr, frecvența de MHz nu este foarte impresionantă) Cu alte cuvinte, supercalculatoarele MPP nu au atins încă limita fizică a puterii lor și vor continua să se dezvolte mulți ani de acum înainte Cluster Computing O altă variantă a unui multicomputer este un computer cluster [Anderson et al , ; Martin şi colab , ] De regulă, un cluster este format din câteva sute sau mii de computere personale sau stații de lucru conectate printr-o rețea și sunt conectate la rețea printr-o placă de rețea convențională Diferența dintre un MPP și un cluster este aceeași ca între un mainframe și un computer personal Ambele au procesor, RAM, discuri, un sistem de operare etc Dar pe mainframe totul (cu posibila excepție a sistemului de operare) rulează mult mai repede și, din această cauză, sunt folosite și gestionate în complet diferit moduri Același lucru se poate spune despre MPP-uri și clustere Până acum câțiva ani, interacțiunea dintre elementele care formează MRR era mult mai rapidă decât între mașinile care alcătuiesc clusterul Cu toate acestea, odată cu apariția rețelelor de mare viteză pe piață, acest decalaj a început să dispară Este probabil ca clusterele să înlocuiască treptat mașinile MMP, la fel cum computerele personale au înlocuit mainframe-urile, care sunt acum folosite doar în domenii foarte specializate Principala nișă pentru sistemele MMP va rămâne supercomputerele scumpe, în care principalul lucru este performanța, iar costul trece pe marginea drumului Există multe tipuri de clustere, dintre care două domină: centralizate și descentralizate Centralizat este un grup de stații de lucru sau computere personale montate într-o structură mare în aceeași cameră Uneori sunt amplasate mai compact decât de obicei pentru a reduce dimensiunea fizică și lungimea cablului De regulă, toate mașinile incluse în cluster sunt omogene și nu au niciun dispozitiv periferic, cu excepția plăcilor de rețea și, eventual, a unităților de disc Gordon Bell, designerul PDP- și VAX, le-a numit stații de lucru fără cap, sugerând că aceste mașini nu aveau proprietari Clusterele descentralizate constau din stații de lucru sau computere personale împrăștiate într-o clădire sau campus Majoritatea dintre ei stau inactiv multe ore pe zi, mai ales noaptea De obicei, acestea sunt conectate printr-o rețea locală Sunt eterogene și au un set complet de periferice, deși un grup cu o mie de șoareci nu este mai bun decât un grup fără șoareci Cel mai important, multe dintre mașinile din cluster au proprietari, fiecăruia dintre care nu le pasă de mașina lui și nu este prea loial faptului că vreun astronom încearcă să-l implice în calcule legate de teoria big bang-ului Dacă, pe de altă parte, utilizați numai mașini inactive pentru a organiza clusterul, cu siguranță aveți nevoie de un fel de mecanism de migrare a jobului pentru a elibera mașina atunci când proprietarul are nevoie de el Deși problema migrării locurilor de muncă este destul de rezolvabilă, soluția necesită o complexitate software suplimentară Clusterele sunt adesea mici, variind de la o duzină la poate de computere Cu toate acestea, este posibil să construiți un cluster foarte mare de la PC-uri convenționale Google a venit cu un mod interesant de a face acest lucru, pe care îl vom analiza aici Google Google este un motor de căutare de informații popular pe Internet Își datorează popularitatea simplității interfeței și timpului redus de răspuns, deși elementele interne ale Google pot fi numite orice, decât simple Din punctul de vedere al motorului de căutare, sarcina este de a indexa și stoca întregul World Wide Web (și acesta este mai mult de de miliarde de pagini), apoi găsiți pagina dorită printre informațiile stocate în , secunde, servind zeci de mii de cereri pe secundă, non-stop, venite din toate colțurile lumii În plus, sistemul nu ar trebui să se defecteze niciodată, chiar și în caz de dezastre naturale, întreruperi de curent și rețea, defecțiuni hardware și software Dezvoltarea unei clone Google cu siguranță nu este un exercițiu pentru cititor Cum face Google toate acestea? Funcționarea Google este asigurată de multe centre de informare din întreaga lume Acest lucru nu numai că face posibilă înlocuirea în cazul unei inundații sau unui cutremur La accesarea adresei www google com se analizează adresa IP a expeditorului solicitării, iar apoi browserul comunică doar cu centrul de informare cel mai apropiat de acesta Fiecare centru de date este conectat la Internet prin cel puțin o linie de fibră optică OS- ( Gbps), prin care se primesc solicitările și se trimit răspunsurile înapoi În plus, există o linie suplimentară OS- ( Mbps) pentru furnizorul de servicii de rezervă în cazul unei întreruperi în activitatea celui principal Pentru a se asigura că spectacolul poate continua chiar și în timpul întreruperilor de curent, toate centrele au surse de alimentare neîntreruptibile și generatoare diesel de urgență Astfel, în timpul dezastrelor naturale, activitatea Google nu va fi perturbată, deși performanța va scădea Pentru a înțelege mai bine de ce Google a ales această arhitectură specială, este util să ne uităm la modul în care este procesată o solicitare atunci când vine vorba de centrul de informații Solicitarea primită (pasul din Figura ) este redirecționată de echilibrator de încărcare către unul dintre numeroșii manipulatori de cereri ( ) și, în paralel, către verificatorul ortografic ( ) și serverul de publicitate contextuală ( ) În paralel, căutarea cuvântului solicitat este efectuată pe serverele de index ( ), care stochează înregistrările fiecărui cuvânt pe Web În fiecare astfel de intrare, sunt enumerate toate documentele care conțin acest cuvânt (acest pot fi pagini web, PDF-uri, prezentări PowerPoint etc ) Legăturile din aceste liste sunt aranjate în funcție de rangul paginii, parametru care se calculează folosind o formulă complexă Principiul calculării ratingului este ținut secret, dar se știe că numărul de link-uri către pagină și ratingurile paginilor care leagă la aceasta sunt de mare importanță Pentru a îmbunătăți performanța, indexul este împărțit în segmente care sunt căutate în paralel Conform acestei idei, segmentul conține toate cuvintele din index, iar fiecare cuvânt este asociat cu identificatorii primelor n pagini cotate Segmentul conține toate cuvintele și identificatorii următoarelor n pagini clasate și așa mai departe Pe măsură ce Web-ul crește, fiecare dintre aceste segmente poate fi împărțit în mai multe părți, astfel încât prima parte să conțină primele k cuvinte, a doua următoarea k cuvinte și m e Acest lucru vă permite să obțineți un paralelism și mai mare în căutare Serverele de index returnează seturi de ID-uri de document ( ) care sunt apoi combinate conform logicii de interogare De exemplu: +digita +kapibara +dans Cu o astfel de solicitare, doar identificatorii acelor documente care se află în toate cele trei seturi vor trece la pasul următor În acest pas, Google accesează el însuși documentele ( ), extragând din ele titluri, link-uri, precum și fragmente de text care înconjoară cuvintele solicitate Copii ale multor documente ale Rețelei sunt stocate pe serverele de documente ale tuturor centrelor de informare, în prezent volumul acestora ajungând la sute de terabytes Pentru a accelera paralela documentele de căutare sunt de asemenea* împărțite în segmente Drept urmare, deși procesarea unei interogări nu necesită citirea întregului conținut al rețelei (și procesarea a zeci de terabytes de indici), atunci când deserviți o interogare obișnuită, trebuie totuși să „retorniți” cel puțin MB de date După ce rezultatele sunt returnate la manipulatorul de cereri (I), acestea sunt combinate în funcție de rangul paginii Sunt adăugate informații despre posibilele erori de ortografie dacă sunt găsite ( ) și publicitate contextuală ( ) Includerea în rezultatele interogării a anumitor cuvinte cheie cumpărate de agenții de publicitate (de exemplu, „hotel” sau „cameră video”) este ceea ce Google câștigă bani În cele din urmă, rezultatele sunt formatate în HTML (HyperText Markup Language) și livrate utilizatorului ca o pagină web normală Acum, pe baza cunoștințelor acumulate, putem studia arhitectura Google Majoritatea companiilor, confruntate cu nevoia de a menține o fază de date uriașă și foarte fiabilă cu un număr mare de tranzacții, achiziționează cel mai rapid și mai fiabil hardware disponibil pe piață Google a făcut exact invers Au cumpărat computere personale* ieftine, cu performanțe medii O mulțime de computere Combinând aceste mașini, au construit cel mai mare grup de componente obișnuite din lume Principiul principal din spatele acestei soluții este simplu: optimizarea raportului preț/performanță Decizia a avut rădăcini în economie: computerele personale obișnuite sunt suficient de ieftine Pentru serverele high-end, nu este cazul, dar pentru multiprocesoare mari, este de două ori așa De exemplu, performanța unui server puternic poate fi de - ori mai mare decât performanța unui computer mediu, dar de obicei costă de - ori mai scump decât de - ori Desigur, un computer personal ieftin este mult mai puțin fiabil decât cele mai bune modele de servere, dar serverele se blochează uneori Deci, software-ul Google este scris pentru a rula fiabil pe hardware nesigur Având la dispoziție software-ul cu toleranță la erori, nu contează cu adevărat dacă rata de eșec este de , % sau % pe an Experiența Google arată că % din toate computerele se defectează într-un an Mai mult de jumătate dintre defecțiuni sunt cauzate de hard disk-uri, urmate de surse de alimentare, urmate de cipuri de memorie Procesoarele, după rulare, nu se rup deloc De fapt, principala cauză a defecțiunilor nu este hardware-ul, ci software-ul Prin urmare, prima reacție la o eroare este repornirea, ceea ce în majoritatea cazurilor rezolvă problema (acesta poate fi numit analogul electronic al rețetei „două aspirine noaptea”), Un PC modern tipic folosit de Google are un procesor Pentium de GHz, GB RAM și TB spațiu de stocare Poate că bunica ta folosește o mașină similară pentru a scana ocazional e-mailurile Doar cipul Ethernet merită o atenție specială Nu poate fi numită o operă de artă, dar este foarte ieftină Calculatoarele sunt găzduite în carcase de înălțime II (aproximativ cm) și sunt instalate în rafturi verticale, câte de bucăți fiecare din față și din spate Într-un rack, astfel, sunt instalate de mașini, care sunt conectate nr conectarea la Ethernet folosind un comutator din interiorul rackului Toate rafturile dintr-un centru de date sunt, de asemenea, conectate la Ethernet printr-un comutator și există două comutatoare redundante pentru supraviețuirea la failover Structura unui centru de informare Google tipic este prezentată în Fig Datele de la linia de fibră optică de mare viteză OS- sunt transmise la două switch-uri Ethemet cu de porturi Linia de rezervă OS- este conectată la ei în același mod O placă specială este utilizată pentru a conecta canalele de intrare, astfel încât acestea să nu ocupe porturile comutatoarelor Ethernet Există patru linii Ethernet care ies din fiecare rack, două către comutatorul afișat în stânga și două către dreapta Acest lucru permite sistemului să supraviețuiască defecțiunii oricăruia dintre cele două comutatoare Din cauza celor patru linii, pierderea comunicării cu rack necesită fie ca toate cele patru linii să eșueze, fie două linii și comutatorul să eșueze Cu o pereche de switch-uri cu de porturi și rafturi cu patru linii, de rafturi pot fi conectate în rețea Dacă presupunem că există de computere într-un rack, acest lucru dă un total de de mașini, deși, desigur, nimeni nu cere ca într-un rack să fie exact de computere și chiar și comutatoarele pot avea mai mult de de porturi Doar că acestea sunt valori foarte tipice pentru clusterul Google Linie de fibră optică OS- Linie de fibră optică OS- Comutator Gigabit Ethernet cu de porturi Comutator Gigabit Ethernet cu de porturi Raft pentru buc Două legături pentru o rețea Gigabit Ethernet Orez Cluster Google tipic Consumul specific de energie pe unitatea de suprafață este, de asemenea, de mare importanță Un computer personal tipic consumă aproximativ de wați, oferind kW per rack Este necesar un spațiu de minim m pentru ca personalul de întreținere să instaleze și să scoată computerele din rack Astfel, consumul specific de energie este de W/m De obicei, centrele de date sunt proiectate pentru un consum de energie între și W/m , deci sunt necesare măsuri speciale pentru răcire Google a învățat trei reguli pentru construirea și rularea serverelor web mari, pe care este o idee bună să le reproduc aici Orice componente se rup, iar acest lucru trebuie luat în considerare Pentru a îmbunătăți debitul și disponibilitatea, totul trebuie duplicat Este necesara optimizarea raportului pret/performanta Primul element înseamnă de fapt că software-ul trebuie să fie tolerant la erori Chiar și cel mai bun hardware se va rupe mai devreme sau mai târziu dacă este suficient și trebuie programată această posibilitate Un sistem de această dimensiune ar trebui să supraviețuiască eșecurilor, chiar dacă acestea apar de mai multe ori pe săptămână Al doilea punct indică faptul că atât software-ul, cât și hardware-ul trebuie să fie redundante Acest lucru nu numai că face ca sistemul să fie tolerant la erori, dar crește și debitul În cazul Google, computerele în sine, discurile, cablurile, sursele de alimentare și comutatoarele lor sunt duplicate de mai multe ori În plus, segmente de indici și documente sunt duplicate în același centru Centrele de informare în sine sunt duplicate Al treilea punct este o consecință a primelor două Dacă sistemul răspunde corect la defecțiuni, este o prostie să cumpărați componente scumpe, cum ar fi matrice RAID sau unități SCSI Chiar și ei se sparg, iar cheltuirea de zece ori mai mult pentru a reduce la jumătate rata de eșec este o idee proastă Este mai bine să cumpărați de zece ori mai multe echipamente și să anticipați posibilitatea defecțiunilor La urma urmei, cu cât mai mult hardware, cu atât performanța este mai bună (când hardware-ul rulează) Pentru mai multe informații despre Google, a se vedea [Barroso et al , ; Gheinaw; et al , ] Software de comunicații pentru multicalculatoare Programarea unui multicomputer necesită un software special (de obicei biblioteci) care permite interacțiunea între procese și sincronizare Rețineți că, în majoritatea cazurilor, pachetele software sunt destinate atât mașinilor MPP, cât și clusterelor, astfel încât aplicațiile sunt portabile între platforme În sistemele de mesagerie, două sau mai multe procese funcționează independent unul de celălalt De exemplu, unul dintre procese poate genera date, iar celălalt (sau altele) le pot consuma Dacă expeditorul are mai multe date, nu garantează că destinatarii sunt pregătiți să accepte aceste date, deoarece fiecare proces funcționează conform propriului program Majoritatea sistemelor de mesagerie folosesc cele două primitive send și geceive, dar alte semantice sunt posibile Cele trei opțiuni principale sunt: + mesagerie sincronă; + trecerea mesajului tamponat; + transmiterea mesajului neblocant În mesageria sincronă, dacă expeditorul efectuează o operație de trimitere și receptorul nu a efectuat încă o operațiune de recepție, emițătorul se blochează (se suspendă) până când destinatarul efectuează o operație de recepție, moment în care mesajul este copiat Când controlul este returnat expeditorului, acesta știe deja că mesajul trimis a fost primit Această metodă are o semantică simplă și nu necesită tamponare Dar are un dezavantaj serios: expeditorul este blocat până când destinatarul acceptă mesajul și îl confirmă În cazul mesageriei în buffer, mesajul trimis este stocat temporar undeva (de exemplu, în cutia poștală) până când destinatarul este gata să-l ridice de acolo Cu această abordare, expeditorul poate continua să lucreze după finalizarea operațiunii de trimitere, chiar dacă destinatarul este ocupat în acel moment Deoarece mesajul a fost deja trimis, expeditorul poate utiliza imediat din nou tamponul de mesaje Această schemă reduce timpul de întârziere Cu toate acestea, nu există nicio garanție că va fi primit un mesaj Chiar și cu un sistem de comunicare fiabil, există întotdeauna șansa ca destinatarul să nu poată primi mesajul din cauza unei eșecuri În transmiterea de mesaje fără blocare, expeditorul poate continua imediat după efectuarea unui apel Singura sarcină a bibliotecii este să spună sistemului de operare să proceseze apelul atunci când are timp Drept urmare, expeditorul nu este blocat deloc Dezavantajul acestei metode este că atunci când expeditorul continuă după operația de trimitere, acesta nu poate utiliza din nou buffer-ul de mesaje, deoarece există posibilitatea ca mesajul să nu fi fost încă trimis Expeditorul trebuie să determine cumva că poate utiliza din nou tamponul De exemplu, puteți interoga sistemul O altă opțiune este de a efectua o întrerupere a sistemului atunci când tamponul este eliberat Cu toate acestea, ambele opțiuni necesită software sofisticat În continuare, ne vom uita la un sistem de mesagerie popular care este utilizat în multe computere multiple RMN În urmă cu câțiva ani, pachetul PVM (Parallel Virtual Machine) era considerat cel mai popular pachet pentru schimbul de informații între multicalculatoare [Geist et al, ; Sunderram ] Cu toate acestea, acum a fost aproape universal înlocuit de pachetul MPI (Message-Passing Interface) Pachetul MPI este mult mai complex decât PVM; acceptă mult mai multe apeluri de bibliotecă și mult mai mulți parametri per apel Prima versiune a RMN, numită acum etsya MP - , în a fost completat de a doua versiune, MP - În continuare, vom vorbi pe scurt despre MP - , iar apoi vom vedea ce este nou în MP - Pentru informaţii detaliate despre MP , vezi [Gropp et al , ; Snir şi colab , | Pachetul MPI- , spre deosebire de PVM, nu are nimic de-a face cu crearea și managementul procesului Este la latitudinea utilizatorului să creeze procese folosind apeluri de sistem locale Odată create, procesele sunt organizate în grupuri care nu se schimbă Cu aceste grupuri funcționează RMN RMN se bazează pe patru concepte: comunicatori, tipuri de date transmise, operații de comunicare și topologii virtuale Un comunicator este un grup de procese plus un context Contextul slotului este o etichetă care identifică ceva (de exemplu, o fază de execuție) În procesul de trimitere și primire a mesajelor, contextul poate fi folosit pentru a evita mesajele confuze care nu au legătură între ele Tipurile de date transmise în mesaje pot fi diferite, inclusiv simboluri, numere întregi scurte, obișnuite și lungi, numere cu virgulă mobilă de precizie standard și dublă etc În plus, pot fi construite noi tipuri de date din tipurile de date existente RMN-ul suportă multe operațiuni de comunicare Iată cum vedeți operația de trimitere a mesajelor: MPI Send(buffer, număr de elemente, tip date, destinație, etichetă, comunicator) În acest apel, conținutul buffer-ului este transmis receptorului, care conține elemente de tip data type în numărul de -elemente Câmp etichetă :>m do top := top - ; return stiva[sus]; od; Sfârşit; # o funcție care nu returnează nimic # împingeți elementul pe stivă # incremente indicatorul stivei # o funcție care returnează un număr întreg # se întrerupe dacă stiva este goală # reduce indicatorul stivei # returnează partea de sus a stivei începe de sus:= ; Sfârşit; # inițializare După definirea obiectului stivă, puteți declara variabile de acest tip: s, t, stack; Această notație creează două obiecte de stivă și setează variabila vârf din fiecare obiect la Variabila întreagă k poate fi împinsă pe stiva s cu instrucțiunea s$push(k); Operația pop conține o gardă, așa că încercarea de a scoate o variabilă dintr-o stivă goală va determina suspendarea procesului de apel până când un alt proces împinge ceva în stivă Orca are un operator pentru generarea unui nou proces, fork Noul proces începe procedura specificată în instrucțiunea fork Alți parametri pot fi transferați noului proces, inclusiv un obiect Acesta este modul în care obiectele sunt alocate mașinilor De exemplu: for i ip n do fork foobar(s) on i; od; Această declarație generează un nou proces pe toate mașinile de la la n, rulând programul foobar pe fiecare Deoarece aceste n procese noi (precum și procesul inițial) rulează în paralel, toate pot împinge elemente în stiva comună și pot pop elemente din stiva comună ca și cum toate ar rula pe un multiprocesor cu memorie partajată Sistemul executiv creează iluzia unei amintiri comune care nu există cu adevărat Operațiile pe obiecte partajate sunt atomice și consecvențial Adică, sistemul garantează că, dacă mai multe procese efectuează operațiuni cu un singur obiect aproape simultan, sistemul însuși stabilește o anumită secvență de evenimente pe care toate procesele le percep În Orca, datele partajate și sincronizarea sunt implementate diferit decât în sistemele de paginare Sunt necesare două tipuri de sincronizare în programele paralele Prima este excluderea reciprocă Excluderea reciprocă împiedică două procese să execute aceeași secțiune critică de cod în același timp În Orca, fiecare operație pe un obiect partajat este ca și cum ar fi executarea unei secțiuni critice, deoarece sistemul garantează că rezultatul final va fi același ca și cum toate secțiunile critice ale codului ar fi executate pe rând În acest sens, un obiect din Ogs este similar cu un monitor distribuit [Hoars, ] Al doilea tip de sincronizare este sincronizarea condiționată, în care un proces se blochează în așteptarea îndeplinirii unei anumite condiții În Ogsa, sincronizarea condiționată se realizează folosind siguranțe În exemplul din Listarea , un proces care încearcă să scoată un element dintr-o stivă goală blochează până când există elemente pe stivă Orca acceptă replicarea obiectelor, migrarea și consistența obiectelor, precum și invocarea operațiunilor asupra acestora Fiecare obiect poate fi într-unul și două stări: poate fi unică sau replicată În primul caz, obiectul există doar pe o singură mașină, așa că toate cererile sunt trimise acolo Obiectul replicat este prezent pe toate mașinile și; pe care se execută procesul care utilizează acest obiect Acest lucru simplifică operațiunile de citire (pentru că se poate face local), dar complică actualizarea trebuie să obțineți numărul de secvență al procesului de la procesul central Zatsl trimite un mesaj către fiecare mașină care conține o copie a obiectului pentru a efectua operația specificată Deoarece toate aceste actualizări sunt numerotate în ordine, fiecare mașină pur și simplu execută operațiunile în acea ordine, ceea ce garantează consistența secvențială Performanţă Scopul unui computer paralel este de a-l face să ruleze mai repede decât o mașină cu un singur procesor Dacă acest obiectiv nu este atins, nu are rost să dezvoltam un computer paralel În plus, acest obiectiv ar trebui atins la un cost minim O mașină care rulează de două ori mai repede decât un singur procesor, dar costă de de ori mai mult decât acesta din urmă este puțin probabil să fie la cerere În această subsecțiune, luăm în considerare câteva aspecte ale performanței arhitecturilor de computere paralele Valori hardware Din punct de vedere hardware, viteza procesoarelor, a dispozitivelor I/O și a rețelei de comunicații este de cel mai mare interes Deoarece viteza procesoarelor și a dispozitivelor de intrare-ieșire este aceeași ca la o mașină cu un singur procesor, parametrii rețelei de comunicații sunt cheie într-un sistem paralel Există două valori cheie aici: latența și debitul Le vom lua în considerare pe rând Latența totală, sau timpul de răspuns, este timpul necesar procesorului pentru a trimite un pachet și a primi un răspuns Dacă pachetul este trimis în memorie, atunci latența este timpul necesar pentru a citi și scrie un cuvânt sau un bloc de cuvinte Dacă un pachet este trimis către un alt procesor, atunci latența este timpul necesar pentru a transfera pachete de o anumită dimensiune între procesoare De obicei, latența pentru pachetele de cea mai mică dimensiune (de obicei un cuvânt sau o linie de cache mică) este de interes Cantitatea de latență este determinată de mai mulți factori, iar această dată este diferită pentru tehnologiile de comutare de circuite, comutare cu stocare și redirecționare, rutare virtuală end-to-end În cazul comutării circuitului, latența este suma timpului de configurare a conexiunii și a timpului de transmisie Pentru a stabili o conexiune, este trimis un pachet de probă care vă permite să rezervați resursele necesare, este returnat un mesaj cu un raport După aceea, puteți asambla pachetul de date Când pachetul este gata, biții pot fi transmisi la viteză maximă, deci dacă timpul total de configurare a conexiunii este T, dimensiunea pachetului este de p biți și debitul este de b biți/s, latența unidirecțională este T + p /b Dacă schema este duplex și nu este necesară nicio conexiune pentru răspuns, latența minimă pentru transmiterea unui pachet p-bit și primirea unui răspuns p-bit este T + Tp/b secunde La schimbarea pachetelor, nu este necesar să se trimită un pachet de test destinatarului în avans, dar este nevoie de ceva timp pentru a asambla pachetul Aici, timpul de transmisie unidirecțională este T + p/b, dar în această perioadă pachetul ajunge doar la primul comutator Trecerea prin comutator în sine are ca rezultat o oarecare întârziere, Tr trece apoi la următorul comutator și așa mai departe Timpul Td constă din timpul de procesare și întârzierea în coadă (când trebuie să așteptați până când portul de ieșire devine liber) Dacă există n comutatoare, atunci timpul total de întârziere într-un singur sens este T + n(p/b + + T;) + p/b, unde ultimul termen reflectă faptul că pachetul a fost transmis de la ultimul comutator la destinatar ovt multicalculatoare Latența unidirecțională pentru rutarea virtuală end-to-end se apropie în cel mai bun caz de T + p/h, deoarece nu există pachete de probă pentru a stabili o conexiune și nicio întârziere de stocare și redirecționare În esență, acesta este timpul de asamblare a pachetului plus timpul de transmisie a biților De asemenea, ar fi necesar să adăugați întârzierea de propagare a semnalului, dar în toate cazurile este mică Următoarea măsurătoare hardware este debitul Multe programe paralele, în special în științele naturii, sunt orientate spre mutarea unor cantități uriașe de date, astfel încât numărul de octeți pe care un sistem poate transfera pe secundă este o măsură foarte importantă a performanței Există mai multe valori de debit Am luat în considerare deja unul dintre ele - debitul secțiunii (a se vedea subsecțiunea „Rețele de comunicații” din secțiunea „Multicomputere”) O altă măsurătoare, debitul agregat, este calculată prin însumarea debitului tuturor legăturilor Acest număr indică numărul maxim de biți care pot fi transmiși la un moment dat O altă măsură importantă este debitul mediu al fiecărui procesor Dacă fiecare procesor poate produce date doar la o viteză de MB/s, atunci o rețea cu o lățime de bandă transversală de GB/s este de puțin folos Viteza de interacțiune în acest caz este limitată de capacitățile de viteză ale fiecărui procesor În practică, este foarte dificil să se abordeze debitul posibil teoretic Motivele pentru aceasta pot fi foarte diferite De exemplu, fiecare pachet conține întotdeauna date de service legate de asamblare, crearea antetului, trimitere Când trimitem de pachete de octeți fiecare, nu vom ajunge niciodată la același debit ca atunci când trimitem un pachet de de octeți Cu toate acestea, pentru a reduce latența, este mai bine să folosiți pachete mici, deoarece pachetele mari blochează liniile și comută mult timp Ca rezultat, există un conflict între modul de a obține o latență scăzută și un randament ridicat Pentru unele aplicații, latența este mai importantă, pentru altele, debitul este mai important Dar, în orice caz, este important de înțeles că debitul poate fi întotdeauna crescut în detrimentul costurilor suplimentare de material (prin adăugarea mai multor fire sau instalarea de fire mai largi), dar în ceea ce privește reducerea latenței, injecțiile financiare nu vor ajuta aici Prin urmare, de obicei, este mai bine să aveți grijă de latența minimă de la bun început și abia apoi să vă gândiți la debit Valorile programului Valorile hardware, cum ar fi latența și debitul, arată de ce este capabil hardware-ul Dar utilizatorii sunt interesați de ceva complet diferit Vor să știe cu cât de repede vor rula programele lor pe un computer paralel în comparație cu un singur procesor Pentru ei, metrica cheie este accelerarea: cu cât de repede rulează un program pe un sistem cu n procesoare în comparație cu un sistem cu un singur procesor Rezultatele sunt de obicei ilustrate grafic (Figura ) Aici vedem mai multe programe paralele diferite care rulează pe un multicomputer, constând un total de de procesoare Pentium Pro Fiecare curbă arată accelerarea unui program cu k procesoare în funcție de k Linia punctată reprezintă accelerarea ideală în care utilizarea k procesoare face ca programul să ruleze de k ori mai rapid pentru orice k Puține programe ating accelerația ideală, deși există destul de multe programe care se apropie de ideală Problema modelării N corpuri din cauza paralelismului este rezolvată mult mai repede, accidentele (jocul african, numit și „kalah”) sunt de asemenea calculate mai repede, dar este imposibil să grăbiți inversarea unei anumite matrice de profil de mai mult de cinci ori , indiferent câte procesoare folosim Programele și rezultatele sunt discutate în [Bal et al , ] Problemă de modelare N-corpuri Avari Inversarea matricei de profil Numărul de procesoare Orez În practică, programele nu pot atinge accelerarea ideală (indicată prin linie punctată) Există o serie de motive pentru care este aproape imposibil să se obțină o accelerare perfectă: în aproape toate programele există fragmente care sunt executate în mod fundamental secvențial, cum ar fi inițializarea, citirea datelor brute sau obținerea de rezultate Creșterea numărului de procesoare nu va ajuta aici Să presupunem că un program rulează pe un computer uniprocesor timp de T secunde, cu o fracțiune (/) din acest timp fiind executată secvențial și o fracțiune ( - /) executând potențial în paralel, așa cum se arată în Fig a Dacă codul paralel poate fi rulat pe n procesoare, atunci timpul de execuție al acestui cod se va reduce cel mai bine de la ( - f)T la ( - f)T / n, așa cum se arată în Fig , b Ca urmare, timpul total de execuție a programului (atât codul serial, cât și codul paralel) va fi fT + ( - f)T/n Accelerația este timpul de execuție al programului original (T) împărțit la acest nou timp: multi KOM n»ii I foarte accelerare = P Pentru f = putem obține o accelerare liniară, dar pentru f > accelerația ideală nu este realizabilă deoarece există o parte serială în program Acest fenomen se numește Legea lui Amdahl n procesoare de lucru paralel Partea care poate Parte fundamental consistentă A b Orez Pe lângă partea de serie, programul conține și partea care poate fi executată în paralel (a); rezultat al prelucrării paralele a unei părți a programului (b) Legea lui Amdahl este doar unul dintre motivele pentru care accelerația perfectă nu este realizabilă Un anumit rol în acest sens îl joacă timpul de întârziere în liniile de comunicație și lățimea de bandă limitată și deficiențele algoritmilor Chiar dacă am avea de procesoare, nu toate programele ar putea fi scrise pentru a le folosi pe toate, iar suprasarcina de a rula atât de multe procesoare ar putea fi destul de semnificativă Mai mult, mulți algoritmi cunoscuți aproape că nu sunt susceptibili de procesare paralelă, așa că trebuie înlocuiți cu algoritmi cvasi-optimi În același timp, pentru multe probleme aplicate, ar fi foarte de dorit ca programul să ruleze de n ori mai rapid, chiar dacă acest lucru necesită n procesoare La urma urmei, procesoarele nu sunt chiar atât de scumpe și multe companii nu sunt supărate că alte domenii ale afacerii lor sunt cu mult sub % eficiente Tehnici de performanță Cea mai evidentă modalitate de a îmbunătăți performanța sistemului este să adăugați procesoare Cu toate acestea, trebuie să adăugați procesoare astfel încât blocajele să nu apară în sistem Sistemul, după adăugarea procesoarelor la care există o creștere corespunzătoare a performanței, se numește scalabil Luați în considerare procesoare conectate printr-o magistrală comună (Fig , o) Imaginați-vă că am extins sistemul la procesoare adăugând încă (Figura b) Dacă lățimea de bandă a magistralei este de b MB/s, atunci prin multiplicarea de patru ori a numărului de procesoare, vom reduce lățimea de bandă disponibilă fiecărui procesor de la / MB/s la / MB/s Un astfel de sistem nu poate fi numit scalabil riDOLieCCOD a B C D Orez Un sistem de procesoare conectate printr-o magistrală comună (a); sistemul procesoare conectate printr-o magistrală comună (b); grila de comunicare de la procesoare (in); matrice de comunicații de procesoare (d) Și acum să facem același lucru cu grila de comunicații (Fig , c, d) Într-o astfel de topologie, adăugarea de noi procesoare înseamnă adăugarea de noi legături de comunicație, astfel încât atunci când sistemul se scalează, debitul total al fiecărui procesor nu scade, așa cum este cazul magistralei De fapt, raportul link-to-procesor crește de la cu procesoare ( link-uri) la cu procesoare ( link-uri), astfel încât pe măsură ce se adaugă mai multe procesoare, debitul total al fiecărui procesor crește Desigur, debitul nu este singurul parametru Adăugarea procesoarelor la magistrală nu crește diametrul rețelei sau latența, în timp ce adăugarea procesoarelor la rețea o face Diametrul unei rețele n x n este (n - ), deci în cel mai rău caz, latența crește aproximativ ca rădăcină pătrată a numărului de procesoare Pentru de procesoare, diametrul este de , pentru de procesoare este de , deci dacă multiplicați de patru ori numărul de procesoare, atunci diametrul și, în consecință, latența medie, se va dubla aproximativ În mod ideal, un sistem scalabil ar trebui să păstreze același debit mediu per procesor și o latență medie constantă atunci când adaugă procesoare noi În practică, menținerea unui debit suficient pentru fiecare procesor este fezabilă, dar latența crește pe măsură ce crește numărul de procesoare Cel mai bine ar fi să-l faci să crească logaritmic, ca într-un hipercub Ideea este că latența este adesea fatală pentru performanța aplicațiilor mici și mijlocii Dacă un program are nevoie de date care nu se află în memoria locală, este nevoie de o perioadă semnificativă de timp pentru a-l obține și, cu cât sistemul este mai mare, cu atât este mai mare întârzierea Această problemă este comună atât pentru multiprocesoare, cât și pentru multicalculatoare, deoarece ambele arhitecturi împart memoria fizică în module fixe, distribuite Există mai multe tehnici folosite de dezvoltatorii de sisteme pentru a reduce sau cel puțin a masca latența Prima tehnologie este replicarea datelor Dacă copiile unui bloc de date pot fi stocate în mai multe locații, atunci viteza de acces la aceste date poate fi mărită O posibilă opțiune este utilizarea unui cache, în care una sau mai multe copii ale blocurilor de date sunt stocate lângă un loc unde ar putea fi necesare și căruia îi „aparțin” O altă opțiune este să stocați mai multe carne de cal egală (spre deosebire de relația inegală părinte-subordonat caracteristică memoriei principale și memoriei cache) În acest caz, este foarte important cine, când și unde sunt plasate aceste copii Aici, sunt posibile o varietate de opțiuni, de la alocarea dinamică bazată pe hardware a datelor la cerere până la plasarea lor forțată în timpul încărcării folosind directivele compilatorului corespunzătoare În orice caz, sarcina de a conduce coordonarea vine în prim plan A doua tehnică este mascarea latenței prin ceea ce este cunoscut sub numele de preîncărcare, în care un articol este apelat înainte de a fi necesar Acest lucru permite ca procesul de apelare și procesul de execuție să se suprapună deoarece programul primește fără întârziere elementul de date solicitat Preluarea poate fi implementată atât în hardware cât și în software În cazul preluării, încărcați nu numai cuvântul dorit în cache, ci și întreaga linie cache care îl conține, în așteptarea că alte cuvinte din această linie vor fi utile în viitor Preîncărcarea poate fi, de asemenea, controlată direct Când compilatorul află că programul va avea nevoie de anumite date în timpul execuției, introduce o comandă pentru a le introduce în cod și în așa fel încât să obțină datele necesare la timp O astfel de strategie presupune ca compilatorul să aibă cunoștințe complete despre mașină și mecanismul său de sincronizare și să controleze unde sunt stocate toate datele Comenzile speculative LOAD funcționează cel mai bine atunci când este absolut sigur că datele încărcate vor fi utilizate O eroare de ieșire a paginii la executarea unei comenzi LOAD pe o ramură care nu va fi niciodată necesară este extrem de costisitoare A treia tehnică de mascare a latenței este utilizarea mai multor fire de execuție a programului Dacă comutarea între procese poate fi suficient de rapidă (de exemplu, prin faptul că fiecare proces își alocă propria hartă de memorie și propriile registre), atunci când un fir blochează așteptarea datelor, hardware-ul poate comuta rapid la un alt fir gata de executare În cazul extrem, procesorul execută prima instrucțiune din threadul , a doua instrucțiune din threadul și așa mai departe Astfel, procesorul este mereu ocupat, chiar și cu întârzieri mari pe fire individuale A patra tehnică de mascare a latenței este utilizarea scrierilor neblocante De obicei, la executarea unei instrucțiuni STORF, procesorul așteaptă finalizarea acesteia și abia apoi continuă să funcționeze Cu intrări neblocante, programul continuă să ruleze chiar și atunci când o operație de memorie este în curs Este mai dificil să continui programul în timp ce se execută comanda LOAD, dar chiar și acest lucru este posibil datorită execuției cu o schimbare a secvenței Calcul distribuit Multe dintre sarcinile de astăzi în știință, tehnologie, producție, în domeniul protecției i mediul înconjurător și în alte zone sunt la scară foarte mare și cu mai multe fațete Pentru a le rezolva, este necesar să combinați cunoștințele, abilitățile, instrumentele, capacitățile, programele și datele multor organizații, adesea împrăștiate în întreaga lume Iată doar câteva exemple: + oameni de știință care studiază toate aspectele misiunii pe Marte; + un consorțiu care dezvoltă un produs complex (de exemplu, un avion sau un baraj); + o echipă internațională de salvare care își coordonează acțiunile în timpul unui dezastru natural Unele sarcini necesită mai multă cooperare pe termen lung, altele mai puțin, dar toate au un detaliu comun Diferite organizații lucrează împreună pentru a atinge un obiectiv comun, fiecare folosind propriile sale resurse și propriile sale proceduri de operare Până nu demult era foarte dificil să se asigure colaborarea diferitelor organizații care folosesc sisteme de operare diferite, baze de date și protocoale diferite Cu toate acestea, nevoia tot mai mare de colaborare la scară largă între organizații a condus la dezvoltarea de sisteme și tehnologii pentru combinarea calculatoarelor disparate în ceea ce se numește grid computing Într-un anumit sens, calculul distribuit este următorul pas de-a lungul axei din Fig Un sistem de calcul distribuit poate fi privit ca un cluster eterogen foarte mare, internațional, slab cuplat Scopul sistemului de calcul distribuit este de a crea o infrastructură tehnică care să permită mai multor organizații care urmăresc un obiectiv comun să creeze o singură organizație virtuală Această organizație virtuală ar trebui să fie o structură flexibilă cu un număr de membri în schimbare dinamică, în care membrii individuali să poată lucra împreună în zonele necesare și, în același timp, să își controleze pe deplin propriile resurse Serviciile, instrumentele și protocoalele sunt dezvoltate de cercetători în acest scop și acesta este ceea ce permite membrilor individuali să funcționeze într-o organizație virtuală Un sistem de calcul distribuit este în mod inerent multidimensional, cu un număr mare de egali Poate fi contrastat cu modelele tradiționale de calcul În modelul client-server, doi participanți sunt implicați într-o tranzacție - un server care oferă un anumit serviciu și un client care dorește să-l primească Un exemplu tipic este World Wide Web, unde mulți utilizatori accesează servere pentru informații Sistemele de calcul distribuite diferă, de asemenea, de aplicațiile punct la punct care conectează perechi de mașini pentru a partaja fișiere între ele Un exemplu tipic de aplicație punct la punct este e-mailul Ca o consecință a acestor diferențe, sunt necesare noi protocoale și noi tehnologii Într-un sistem de calcul distribuit, este necesar să se ofere acces la o varietate de resurse Fiecare resursă are propriul său sistem și o organizație care o deține, care decide cât de mult din resursă este disponibilă, la ce oră și cui Fără a intra în detalii, putem spune că esența unui sistem de calcul distribuit este în gestionarea accesului la resurse Una dintre opțiunile de modelare a unui sistem de calcul distribuit este reprezentarea acestuia ca o structură ierarhică cu mai multe niveluri (Tabelul ) Nivelul inferior este nivelul infrastructurii care combină componentele din care este construit sistemul de calcul distribuit În parte pentru hardware, acestea includ procesoare, discuri, rețele și senzori; pentru software, programe și date Acestea sunt resursele fizice accesate de sistemul de calcul distribuit Tabelul Nivelurile ierarhice ale unui sistem de calcul distribuit Descrierea nivelului Stratul de aplicație Aplicații care partajează și utilizează în mod coerent resurse Nivel de echipă Cercetare, mediere, monitorizare, management al grupurilor de resurse Nivel de resurse Securitate și control al accesului pentru resurse individuale Stratul de infrastructură Resurse fizice, inclusiv computere, stocare pe disc, rețele, senzori, software și date Următorul nivel în sus în ierarhie este nivelul resurselor Acest nivel este responsabil pentru gestionarea resurselor individuale Adesea, o resursă inclusă într-un sistem de calcul distribuit este asociată cu un proces local care gestionează resursa și oferă acces controlat la aceasta pentru utilizatori la distanță Scopul acestui strat este de a oferi straturilor superioare o interfață uniformă prin care acestea să se poată întreba despre caracteristicile resurselor individuale, să le monitorizeze și să le folosească în siguranță Chiar mai sus este nivelul echipei, care operează pe grupuri de resurse Una dintre funcțiile sale este o căutare de resurse, prin care utilizatorii găsesc ciclurile procesorului de care au nevoie, spațiu pe disc sau date specifice Nivelul de echipă poate menține cataloage și alte baze de date pentru a furniza informațiile necesare În plus, poate media prin reunirea furnizorilor și utilizatorilor diferitelor servicii și, eventual, alocarea resurselor limitate între utilizatorii concurenți Nivelul de echipă este, de asemenea, responsabil pentru propagarea datelor, includerea de noi participanți și resurse în sistemul de calcul distribuit, contabilitatea și întreținerea bazelor de date cu politicile de acces care descriu ce utilizator are acces la ce resurse În partea de sus a ierarhiei se află stratul de aplicație Aplicațiile utilizator funcționează la acest nivel Stratul de aplicație se referă la straturile inferioare pentru a obține drepturi de utilizare a anumitor resurse, trimite cereri pentru utilizarea acestora, monitorizează progresul solicitărilor, gestionează eșecurile, anunță utilizatorul despre rezultate Securitatea este un factor cheie în succesul unui sistem de calcul distribuit Proprietarii insistă aproape întotdeauna asupra dreptului la control deplin asupra resurselor lor cu monitorizare detaliată (cine, cât timp și cât de mult le folosesc) Fără un sistem de securitate bun, nicio organizație nu și-ar oferi resursele pentru calcularea distribuită Cu toate acestea, dacă utilizatorul ar trebui să-și introducă numele de utilizator și parola pe fiecare computer implicat în calculul distribuit de care avea nevoie, munca utilizatorului ar deveni prea oneroasă Prin urmare, ar trebui dezvoltat un model de securitate care să ia în considerare aceste considerații Capacitatea de conectare unică este una dintre caracteristicile cheie ale modelului de securitate Utilizarea unui sistem de calcul distribuit începe cu înregistrarea și obținerea unui certificat, adică a unui document cu semnătură digitală care indică în interesul cui trebuie efectuată lucrarea Certificatul poate fi delegat, astfel încât, dacă în procesul de calcul sunt necesare unele calcule auxiliare, cu acesta pot fi identificate și procese copil Când un certificat de acces este prezentat unui sistem de la distanță, acesta trebuie mapat la mecanismul său de securitate local De exemplu, UNIX identifică utilizatorii cu identificatori pe biți, dar alte sisteme pot folosi scheme diferite În cele din urmă, este necesar un mecanism prin care politicile de acces să fie stabilite, menținute și actualizate Pentru a susține interacțiunea între diverse organizații și mașini, sunt necesare standarde atât pentru serviciile furnizate, cât și pentru protocoalele de accesare a acestora Pentru a gestiona procesul de standardizare, comunitatea de calcul distribuit a creat o organizație numită Global Grid Forum Rezultatul muncii ei a fost un șablon pentru formarea și dezvoltarea diferitelor standarde, numite OGSA (Open Grid Services Architecture - o arhitectură deschisă pentru servicii de calcul distribuite) Standardele dezvoltate se bazează pe cele existente ori de câte ori este posibil, de exemplu, WSDL (Web Services Definition Language) este folosit pentru a descrie serviciile OGSA Serviciile standardizate în prezent se încadrează în una dintre cele opt categorii, deși această listă va fi, fără îndoială, extinsă în viitor Servicii de infrastructură (oferă interacțiune între resurse) Servicii de management al resurselor (rezervarea și eliberarea resurselor) Servicii de date (copierea și mutarea datelor acolo unde este nevoie) Servicii de context (descrierea resurselor și politicilor necesare pentru utilizarea acestora) Servicii de informare (obținerea de informații despre disponibilitatea unei resurse) Servicii de autocontrol (menținerea calității declarate a serviciului) Servicii de protecție (aplicarea politicilor de securitate) Servicii de control al execuției (controlul fluxului de sarcini) Se pot spune mult mai multe despre sistemele de calcul distribuite, dar volumul cărții nu ne permite să aprofundăm mai mult în acest subiect Informații suplimentare despre aceste sisteme pot fi găsite în [Abramson, ; Balasangameshwara și Raju, ; Celaya și Arronategui, ; Foster și Kesselman, ; Lee și colab , ] Rezumatul capitolului Devine din ce în ce mai dificil să se realizeze o creștere a performanței computerului pur și simplu prin creșterea frecvenței de ceas, pe măsură ce apare problema eliminării căldurii Prin urmare, dezvoltatorii și-au îndreptat atenția către paralelism ca mijloc de a accelera calculele Paralelismul poate fi introdus uneori rezumatul glioamelor alte niveluri, atât la cel mai jos, unde elementele sunt foarte rigid legate între ele, cât și la vârf, unde conexiunile sunt foarte slabe Nivelul inferior este paralelismul intra-procesor, când acțiunile paralele sunt efectuate pe baza unui singur cip O formă de paralelism intraprocesor este paralelismul la nivel de instrucțiune; în acest caz, o comandă sau o secvență de comenzi este împărțită în micro-operații care pot fi executate în paralel de diferite blocuri funcționale A doua formă de paralelism intraprocesor este multithreading; în acest caz, procesorul poate alterna între mai multe fire de execuție de program Rezultatul este un multiprocesor virtual A treia formă de paralelism intraprocesor este multiprocesorul cu un singur cip Într-un multiprocesor cu un singur cip, două sau mai multe nuclee sunt plasate pe același cip, ceea ce le permite să funcționeze simultan Următorul nivel în sus în ierarhie sunt coprocesoarele De obicei, un coprocesor este implementat ca o placă încorporată care vă permite să creșteți puterea de procesare a procesorului în anumite zone speciale, cum ar fi întreținerea protocolului de rețea sau procesarea datelor multimedia Aceste procesoare suplimentare iau sarcina de pe procesorul principal, lăsându-l liber să facă alte lucruri în timp ce efectuează sarcini foarte specializate Cu un nivel mai sus sunt multiprocesoarele cu memorie partajată Astfel de sisteme conțin două sau mai multe procesoare cu drepturi depline care partajează o memorie comună Multiprocesoarele cu acces uniform la memorie (mașini UMA) pot comunica printr-o magistrală comună (magistrală de urmărire) sau printr-o rețea de comutare încrucișată sau în mai multe etape Se caracterizează printr-un timp de acces unificat la orice module de memorie În schimb, în multiprocesoarele NUMA, toate procesele sunt prevăzute cu un spațiu de adrese comun, în timp ce timpul de acces la modulele de la distanță este vizibil mai lung decât la cele locale În cele din urmă, în multiprocesoarele SOMA, liniile cache se mută de la o mașină la alta la cerere, dar aceste linii nu au o „acasă adevărată”, ceea ce este neobișnuit în alte scheme Un multicomputer este un sistem cu multe procesoare, dar g de memorie partajată Fiecare dintre ei are propria sa memorie locală și comunică cu ceilalți prin mesaje Mașinile MPP, cum ar fi BlueGene/l de la IBM, sunt multicalculatoare mari conectate prin rețele de comunicații specializate Clusterele sunt sisteme mai simple, cu componente ușor disponibile (cum ar fi nucleul care alimentează Google) Multicalculatoarele sunt adesea programate cu pachete software speciale, precum MPI, care permit dezvoltarea de aplicații orientate pe mesaje Scheme alternative asociate cu utilizarea memoriei partajate la nivel de aplicație Acestea includ spațiu de adresă paginat în DSM, spațiu de tuplu în Linda, obiecte în Ogsa și Globe Modelele DSM au partajat memorie pe pagină și, în acest sens, sistemul DSM seamănă cu o mașină NUMA, cu excepția posibilului suprasarcină mai mare a acceselor de la distanță ѵ, din «iwrv i rțsri *U ARAIІIKGURY La nivelul superior sunt sistemele de calcul distribuite Acestea sunt cele mai slab cuplate sisteme; ele reunesc organizații întregi pentru a rezolva probleme comune, împărtășindu-și puterea de calcul, datele și alte resurse prin Internet Întrebări și sarcini Lungimea comenzii Intel x poate fi de până la octeți Este x un procesor VLIW? Când progresele tehnologice au permis plasarea mai multor tranzistori pe fiecare cip, Intel și AMD au decis să mărească numărul de nuclee de pe cipurile lor Ar fi putut lua o altă cale? Fie intervalul reprezentării mașinii a numărului - Ce se întâmplă când trunchiați numerele , , și ? Sunt compatibile următoarele comenzi TriMedia și, dacă nu, de ce nu? ) adunare întregi, scădere întregi, încărcare, adunare în virgulă mobilă, încărcare directă; ) scădere întregi, înmulțire întregi, încărcare directă, deplasare; ) încărcare directă, adăugare în virgulă mobilă, multiplicare în virgulă mobilă, ramificare, încărcare directă În fig , d-d arată primele cicluri de instrucțiuni ale mașinii Pentru fiecare opțiune, descrieți ce se întâmplă în următoarele trei cicluri Pe un anumit procesor, o pierdere a memoriei cache la nivelul și o atingere a memoriei cache la nivelul execută k cicluri de mașină Lăsați multithreadingul cu granulație fină să fie folosit pentru a masca erorile de cache din memoria cache de nivelul Câte fire de execuție de program trebuie să ruleze simultan pentru a evita complet buclele inactive? GPU-ul NVIDIA Fermi seamănă cu una dintre arhitecturile descrise în Capitolul Care? Dimineața, regina albină cheamă albinele lucrătoare și le informează că astăzi trebuie să culeagă nectar de gălbenele Albinele lucrătoare zboară din stup și zboară în direcții diferite în căutarea gălbenelelor Ce este acest sistem, SIMD sau MIMD? În discutarea modelelor de consistență a memoriei, am menționat că un astfel de model este un contract între software și memorie De ce este necesar un astfel de contract? Luați în considerare un multiprocesor cu o magistrală comună Ce se întâmplă dacă două procesoare încearcă să acceseze memoria globală în același moment? Luați în considerare un multiprocesor cu o magistrală comună Ce se întâmplă dacă trei procesoare încearcă să acceseze memoria globală în același timp? Să presupunem că, din motive tehnice, memoria cache de urmărire poate urmări doar liniile de adresă, dar nu și liniile de date Va afecta această schimbare protocolul de scriere? Luați în considerare un model simplu de sistem multiprocesor cu o magistrală și fără cache Să presupunem că una din patru instrucțiuni accesează memoria și de fiecare dată când este accesată memoria, magistrala este ocupată pe durata instrucțiunii Dacă magistrala este ocupată, atunci procesorul solicitant este plasat în coada FIFO Cât de repede va rula un sistem cu de procesoare comparativ cu un sistem cu un singur procesor? Protocolul MESI are patru stări Un alt protocol pentru coordonarea cache-urilor de scriere înapoi are trei stări Care dintre statele protocolului MESI pot fi sacrificate și care ar fi consecințele fiecăreia dintre cele patru opțiuni? Dacă ar fi să alegi doar trei stări, pe care le-ai alege? Există situații în protocolul MESI când linia cache este prezentă în memoria cache locală, dar este încă necesară o tranzacție cu magistrala? Dacă da, vă rugăm să descrieți situația Să presupunem că există n procesoare conectate la magistrala comună Probabilitatea ca unul dintre procesoare să încerce să folosească magistrala într-un anumit ciclu este p Care este probabilitatea ca: ) autobuzul este gratuit ( cereri); ) se face o cerere; ) se fac mai multe cereri Numiți principalul avantaj și principalul dezavantaj al conexiunii încrucișate Câte circuite de conexiune încrucișată sunt în procesorul Sun Fire E K cu drepturi depline? Să presupunem că firul dintre comutatorul A și comutatorul B din rețeaua omega este deteriorat Ce elemente vor fi separate unul de celălalt? Hotspot-urile (zonele de memorie care sunt accesate frecvent) în rețelele cu mai multe etape reprezintă o problemă serioasă Sunt acestea o problemă în sistemele de autobuze? Rețeaua omega conectează procesoare RISC, fiecare cu un timp de ciclu de ns, la module de memorie infinit de rapide Fiecare element de comutare dă o întârziere de ns Câte sloturi de amânare sunt necesare pentru o comandă LOAD? Luați în considerare o mașină care utilizează rețeaua omega (vezi Figura ) Să presupunem că programul și stiva i sunt stocate în modulul de memorie i Ce modificări minore de topologie pot face o mare diferență în performanță? (Această topologie modificată este utilizată în IBM RP și BBN Butterfly ) Ce dezavantaj are noua topologie față de cea veche? Într-un multiprocesor NUMA, accesarea memoriei locale durează ns, iar accesarea memoriei altui procesor durează ns Programul face N accesări de memorie în timpul execuției, dintre care % sunt accesări de pagină/' Inițial, această pagină se află în memoria de la distanță și este nevoie de C ns pentru a o copia din memoria locală În ce circumstanțe ar trebui să fie copiată această pagină la nivel local dacă nu o folosește niciun alt procesor? Luați în considerare un multiprocesor CC-NUMA precum cel din fig , dar care conține noduri a câte MB fiecare Dacă linia cache are o lungime de de octeți, care este procentul de supraîncărcare pentru directoare? Cum va afecta creșterea numărului de noduri supraîncărcarea (va crește, va scădea sau va rămâne neschimbată)? Prin ce este diferit modelul NC-NUMA de CC-NUMA? Calculați diametrul rețelei pentru fiecare dintre topologiile prezentate în fig Pentru fiecare dintre topologiile prezentate în fig , determinați factorul de toleranță la erori (numărul maxim de linii de comunicație, după pierderea cărora rețeaua nu va fi împărțită în două părți) Considerăm topologia dublu torus (vezi Figura e) extinsă la k x k Care este diametrul unei astfel de rețele? (Sugestie: k par și impar trebuie luate în considerare separat ) Imaginează-ți o rețea sub forma unui cub de x x Fiecare legătură are o lățime de bandă duplex de GB/s Care este debitul unei secțiuni din această rețea? Legea lui Amdahl limitează potențiala accelerare realizabilă într-un computer paralel Calculați în funcție de / viteza maximă posibilă dacă numărul de procesoare tinde spre infinit Care este valoarea acestei limite pentru / = , ? Figura are scopul de a arăta că scalarea nu este posibilă cu o magistrală, ci posibilă și de dorit cu o rețea Să presupunem că fiecare magistrală sau linie de comunicație are o capacitate b Calculați debitul mediu per procesor pentru fiecare dintre cele patru cazuri Apoi scalați fiecare sistem până la de procesoare și executați aceleași calcule Care este limita dacă numărul de procesoare ajunge la infinit? În această carte, am discutat trei variante ale primitivei de trimitere — sincron, blocant și neblocant Sugerați o a patra opțiune, similară cu blocarea, dar ușor diferită în proprietăți Care sunt avantajele și dezavantajele noii primitive față de operația normală de trimitere de blocare? Luați în considerare un computer care funcționează într-o rețea cu difuzare hardware (ex Ethernet) De ce este important raportul dintre operațiile de citire (care nu schimbă starea internă a variabilelor) și operațiile de scriere (care schimbă starea internă a variabilelor)? Capitolul Bibliografie Acest capitol oferă o listă alfabetică a tuturor cărților și articolelor la care se face referire în această carte Abramson, D : „Mixing Cloud and Grid Resources for ManyTask Coni| ting”, Proc Atelier internațional de calcul al multor sarcini pe rețele și S , Ghemawat, , Gobioff, H și Leung, S -T „Sistemul de fișiere Google”, Proc Symp despre principiile sistemelor de operare, ACM, pp - , Goodman, JR „Utilizarea memoriei cache pentru a reduce traficul memoriei procesorului”, Proc oth Ann Int'l Symp pe Computer Arch , ACM, pp - , Goodman JR „Consistență în cache și consistență secvențială”, Tech Reprezentant (i , IEEE Scalable Coherent Interface Working Group, IEEE, Goth, G „IBM PC Retrospective: There Was Enough Right to Mac ItWork”, IEEE Computer, voi , pp - aug Gropp, H, Lusk, Et și Skjellum, A „Using MPI: Portable Parallel Programming with the Message Passing Interface”, Cambridge, MA: MIT Press, Gupta, N , Mandal, S , Malave,} , Mandal, A și Mahapatra, RN: „A Hardware Scheduler for Real Time Multiprocessor System on Chip”, Proc a -a Conf Internațională pe VLSI Design, IEEE, f Gurumurthi, , Sivasubramaniam, Kandemir, M și Franke, H „Reducing Disk Power Consumption in Servers with DRPM”, IEEE Computer Magazine, voi , pp - , dec Hagersten, E , Landin, A , Haridi, S „DDM - A Cache-Only Memory Architecture”, IEEE Computer Magazine, voi , pp - , sept Haghighizadeh, F, Attarzadeh, H și Sharifkhani, M: „Un cripto-procesor AES compact pe biți”, Proc al doilea Int'l Conf on Computer and Network Technologies , IEEE, Hamming, R W C „Detecția erorilor și codurile de corectare a erorilor”, Beli Syst Tech J , voi , pp - , aprilie Henkel, J , Ni, XS și Bhattacharyya, SS „Taking on the Embedded System Challenge”, IEEE Computer Magazine, voi , pp - , aprilie Hennessy, JL „Arhitectura procesorului VLSI”, IEEE Trans on Computers voi C- , pp - Dec Herrero, E , Gonzalez, J și Canal, R : „Elastic Cooperative Caching: Ar Autonomous Dynamically Adaptive Memory Hierarchy for Chip Multiprocessors” Proc a -a Conf Internațională pe VLSI Design, IEEE, Hoare, CAR „Monitoarele, un concept de structurare a sistemului de operare * Comun al ACM, voi , pp - , oct ; Errata în comun al ACM, voi , p , februarie Hwu, W -M „Introduction to Predicated Execution”, IEEE Computer Magazine voi , pp - , ian Jimenez, D A „Predicția ramurilor neuronale bazată pe calea rapidă”, Proc Al -lea Simp Int despre Microarhitectură, IEEE , pp - , Johnson, K £ , Kaashoek, M E și Wallach, D A „CRL: High-Performance AII Software Distributed Shared Memory”, Proc al -lea Symp despre principiile sistemului de operare, ACM, pp - , Kapasi, UJ, Rixner, S , Dally, WJ, Khailany, B , Ahn, JH, Mattson, P , an Owens, JD "Programmable Stream Processors", IEEE Computer Magazim voi , pp - , aug Kaufman, C , Perlman, R și Speciner, M „Network Security”, al doilea cd , Uppcr Saddle River, NJ: Prentice Hali, Kim, NS, Austin, T , Blaauw, D , Mudge, T , Flautner, K , Hu, JS, Irwin, MJ , Kandemir, M și Narayanan, V Leakage Current: Legea lui Moore Meets Static Power, IEEE Computer Magazine, voi , pp - , dec Knuth, DE: „The Art of Computer Programming: Fundamental Algorithms”, a -a ed Reading, MA: Addison-Wesley, Kontothanassis, L , Hunt, G , Stets, R , Hardavellas, N , Cierniad, M , Parthasarathy, , Meira, W , Dwarkadas, S și Scott, Mt "VM-Based Memorie partajată pe rețele de acces la memorie la distanță cu latență scăzută”, Proc a -a An Int'l Symp pe Computer Arch , ACM, pp - , Lamport, L „How to Mac a Multiprocessor Computer That Correctement Executes Multiprocess Programs”, IEEE Trans pe computere, voi C- , pp - , sept LaRowe, RP și Ellis, C „Compararea experimentală a politicilor de gestionare a memoriei pentru multiprocesoare NUM A”, ACM Trans on Computer Systems, voi , pp - , nov Lee, J , Keleher, P și Sussman, A : „Supporting Computing Element Heterogeneitv in P P Grids”, Proc IEEE Int'l Conf on Cluster Computing, IEEE, pp - , Li, K și Hudak, P „Memory Coherence in Shared Virtual Memory Systems”, ACM Trans on Computer Systems, voi , pp - , nov Lin, Y -N , Lin, Y -D și Lai, Y -C, „Thread Allocation in CMP-based Multithreaded Network Processors”, Parallel Computing, voi , pp - , feb Lu, H , Cox, AL, Dwarkadas, S , Rajamony, R și Zwaenepoel, W „Software Distributed Shared Memory Support for Irregular Applications”, Proc a -a Conf despre Prin, și Practica programului paralel, pp - , iunie Lukasiewicz, J: „Silogistica lui Aristotel”, ed a -a, Oxford: Oxford University Press, Lyytinen, K și Yoo, Y : „Probleme și provocări în calculul omniprezent”, Commun al ACM, voi , pp - , dec Martin, RP, Vahdat, AM, Culler, DE și Anderson, TE „Efectele latenței de comunicare, supraîncărcării și lățimii de bandă într-o arhitectură de cluster”, Proc a -a An Int'l Symp pe Computer Arch , ACM, pp - , Mayhew, D și Krishnan, V „PCI Express and Advanced Switching: Evolutionary Path to Building Next Generation Interconnects”, Proc al ll-lea simptom pe High Perf Interconexiuni IEEE, pp - aug McKusick, MK, Bostic, K , Karels, M și Quarterman, JS „The Design and Implementation of the BSD Operating System”, Reading, MA: Addison-Wesley, McNairy, C și Soltis, D „Itanium Processor Microarchitecture”, IEEE Micro Magazine, voi , pp - , martie-aprilie Mishra, AK, Vijaykrishnan, N și Das, CR, „A Case for Heterogeneous On-Chip Interconnects for CMPs”, Proc Simptomul Internațional al -lea pe Computer Arch ACM, Morgan, C: „Portrete în computer”, New York: ACM Press, Moudgill, M , and Vassiliadis, S "Precise Interrupts", IEEE Micro Magazin* voi , pp - februarie Mullender, SJ și Tanenbaum, A „Immediate Files”, Software Prad ic and Experience, voi , pp - , Naeem, A , Chen, X , Lu, Z și Jantsch, A : „Realizarea și compararea performantă a modelelor de consecvență a memoriei secvențiale și slabe în sistemele multicore bazate pe cip de rețea*”, Proc th Design Automation Conf Asi și South Pacific, IEEE, pp - , Organick, E: „Sistemul MULTICS”, Cambridge, MA: M LT Press, Oskin, M , Chong, FT și Chuang, IL: „A Practicai Architecture for Reliabl Quantum Computers”, IEEE Computer Magazine, voi , pp - , Jai Papamarcos, A/ și Patel , J „O soluție cu coerență redusă a supraîncărcării fc multiprocesoare cu memorii cache private”, Proc a -a Ann Int'l Syinj on Computer Arch , ACM, pp - , Parikh, D , Skadron, K , Zhang, K și Stan, M „Power-Aware Branch Predici loi Characterization and Design”, IEEE Trans pe computere, voi , pp K • * y' Semnul exponentului Mantisei: x -i+Bxi - + cu offset - = o p despre Orez B Exemple de numere normalizate în virgulă mobilă i anexe numere în virgulă mobilă Standardul IEEE Până în anii , fiecare producător a acceptat propriul format în virgulă mobilă Toți erau diferiți unul de celălalt Mai mult, în unele dintre ele, aritmetica a fost efectuată incorect, deoarece aritmetica în virgulă mobilă are unele subtilități care nu sunt evidente pentru designerul hardware obișnuit Pentru a schimba această situație, la sfârșitul anilor , IEEE a instituit Comisia pentru Standardizarea Aritmeticii în virgulă mobilă Scopul a fost nu numai de a face posibilă transferul de date de la un computer la altul, ci și de a oferi dezvoltatorilor de hardware un model corect cunoscut Ca rezultat, standardul IEEE a fost publicat în [IEEE, ] În prezent, majoritatea procesoarelor (inclusiv Intel, SPARC și JVM) conțin instrucțiuni în virgulă mobilă care sunt conforme cu acest standard Spre deosebire de multe standarde care sunt produsul unor compromisuri proaste și al puținilor oameni, acest standard nu este rău și, în mare parte, datorită faptului că a fost dezvoltat inițial de o singură persoană, profesorul de matematică din Berkeley William Kahan (William Kahan) Luați în considerare acest standard Standardul IEEE definește trei formate: precizie simplă ( de biți), precizie dublă ( de biți) și precizie crescută ( de biți) Formatul de precizie îmbunătățită este conceput pentru a reduce erorile de rotunjire Este folosit în principal în aritmetica în virgulă mobilă, așa că nu vom vorbi despre asta Formatele de precizie simplă și dublă folosesc o bază de pentru mantise și un exponent părtinitor Formatele sunt prezentate în fig B Z Biții mantisa Semn Expozant A Biții Semn Orez B Z Formate IEEE în virgulă mobilă: precizie unică (a); dublă precizie (b) Ambele formate încep cu bitul semn pentru întregul număr; indică un număr pozitiv, indică un număr negativ Apoi vine exponentul offset Pentru formatul cu precizie simplă, offset-ul este , iar pentru formatul cu precizie dublă este Minimul ( ) și maximul ( și ) ex- componentele pi sunt folosite pentru numere normalizate Au un scop special, despre care vom vorbi mai târziu La sfârșit există mantise de , respectiv de biți Mantisa normalizată începe cu un punct binar, urmat de bit și apoi restul mantisei În urma practicii începute cu computerul PDP- , informaticienii și-au dat seama că bit în fața mantisei nu trebuie să fie stocat, ci pur și simplu considerat a fi acolo Prin urmare, standardul definește * mantisa după cum urmează Constă dintr-un bit implicit, care este întotdeauna , un punct binar implicit, urmat de sau de biți arbitrari Dacă toți cei sau de biți ai mantisei sunt , atunci mantisa are o valoare* de , Dacă toți biții mantisei sunt , atunci valoarea numerică a mantisei este puțin mai mică de , Pentru a evita confuzia în limba engleză, termenul semnificant este folosit în locul termenului mantisă pentru a desemna o combinație de un bit implicit, un punct binar implicit și sau de biți expliciți Partea semnificativă a numărului ( ) din toate numerele normalizate se află în intervalul SYS I PUSH CX I BP: CC -> p - - => ADD SP I PUSH hw! SI: IP : c:PC SUB CX AX I PUSH-STDOUT! D : start + c PUSH CX I IMPINGE SCRIE E SYS! I ADAUGĂ SP, ! SUB CX AX hw PUSH CX! ■ > Bună lume\n PUSH -EXIT ' hw + = : ( >c c f > f Not Ho World SYS SECT DATE ! hw:! optsprezece ASCII „Hello World\n” I de: BYTE I A b Orez ÎN Codul sursă al programului în limbaj de asamblare (a); fereastra de urmărire cu informații despre progresul execuției programului (b) Să aruncăm o privire rapidă asupra conținutului celor șapte ferestre copil prezentate în Fig B , b În rândul de sus sunt trei ferestre - două mari și una mai mică Fereastra din stânga sus arată conținutul procesorului, și anume valorile curente ale segmentului (CS, DS, SS și ES), aritmetice (AH, AL, A: și alte registre În fereastra din mijloc din rândul de sus, este indicat conținutul stivei - zona de memorie destinată stocării valorilor temporare În fereastra din dreapta sus este afișat un fragment al programului în limbaj de asamblare, săgeata indicând comanda care este în curs de executare Conform ms-ului de execuție a programului, această săgeată, desigur, se mișcă dintr-un singur comp; altcuiva Interpretul poate funcționa într-un mod în care o singură apăsare a tastei Enter are ca rezultat executarea unei comenzi și actualizarea corespunzătoare a tuturor ferestrelor Astfel, un program scris în limbaj de asamblare poate fi executat în mediul simulator cu viteza care | vă permite să vă dați seama ce se întâmplă Fereastra de sub fereastra din stânga sus definește conținutul stivei de apeluri subrutine, care este goală în acest caz Mai jos sunt comenzile proprii ale trasorului Fereastra din dreapta acestor două ferestre este pentru mesaje de intrare, ieșire și de eroare Fereastra cea mai de jos afișează conținutul părții din memorie Vom vorbi mai târziu despre toate aceste ferestre în detaliu, dar deocamdată este important să ne facem o idee generală despre ce informații le permite utilizatorului să vadă trasorul: codul sursă al programului, conținutul registrelor mașinii, informații despre starea programului executabil Pe măsură ce fiecare comandă ulterioară este rulată, conținutul ferestrei interpretorului este actualizat, astfel încât programatorul să poată înțelege procesul cât de detaliat dorește Procesor Orice procesor, inclusiv , are propria sa stare internă, care se referă la una sau alta informație critică Pentru a stoca și procesa aceste informații, procesorul are un set special de registre Cel mai important dintre acestea este registrul PC (Program Counter) Specifică locația de memorie (adresa) care stochează următoarea instrucțiune în ordinea execuției O altă denumire pentru acest registru este IP (Instruction Pointer) Porțiunea din memoria principală care stochează următoarea instrucțiune în ordinea execuției se numește segment de cod Capacitatea de memorie principală permisă suportată de procesorul este puțin peste MB, dar dimensiunea segmentului de cod este limitată la KB Începutul acestui segment într-o memorie de MB este definit în registrul CS (vezi Figura B ) Pentru a activa un nou segment de cod, este suficient să modificați valoarea registrului CS Pe lângă segmentul de cod, există un segment de date, care ocupă și KB și definește începutul datelor Pe fig B începutul datelor este determinat de registrul DS, al cărui conținut poate fi modificat dacă este necesar și, prin urmare, accesează datele care se află în afara segmentului curent Necesitatea registrelor CS și DS se datorează faptului că lățimea registrelor este de biți, ceea ce înseamnă că este imposibil să stocați adresele de de biți necesare pentru a accesa memoria de MB în ele De aceea au apărut segmentul de cod și segmentul de date Alte registre dețin date sau pointeri către date aflate în memoria principală Programele de asamblare accesează direct aceste registre Pe lângă registre, procesorul conține și alt hardware necesar funcționării, dar aceste componente sunt disponibile programatorului doar prin instrucțiuni Ciclul procesorului Munca procesorului (precum și a tuturor celorlalte computere) se reduce la executarea comenzilor într-o anumită secvență Procesul de executare a unei singure comenzi este împărțit în mai multe etape: Cu ajutorul registrului RS, o instrucțiune este preluată din segmentul de cod al memoriei Se adaugă unul la valoarea curentă a contorului programului Comanda selectată este decodificată Toate datele necesare executării comenzii sunt selectate din registrele de memorie și (sau) procesor Comanda este executată Rezultatele executării comenzii sunt stocate în memorie și (sau) registre Începe procesul de executare a următoarei comenzi (treceți la pasul ) Executarea unei comenzi este ca și cum ai executa un program foarte mic În plus, în unele mașini, un program mic (așa-numitul firmware) este de fapt furnizat pentru executarea instrucțiunilor Firmware-ul este discutat în detaliu în Capitolul Din punctul de vedere al unui programator asamblator, procesorul are registre Aceste registre îndeplinesc funcția de memorie scratch, cu care lucrează numeroase instrucțiuni; rezultatele stocate în ele se modifică foarte frecvent Toate aceste registre sunt prezentate în Fig LA Asemănarea dintre această figură și fereastra trasoare prezentată în fig ÎN registre de segmente Registre de uz general AH AN AL IN HV BL CX CH CL DX DH DL CS D S ES cincisprezece segment de cod Segment de date segment de stivă Segment suplimentar IP Codurile de stare III ' O D T SZ A R s steaguri de stare Indicator de instrucțiuni ! Contor de comenzi^ O Orez LA registre de procesor Registrele procesorului au o lățime de biți Nu există un singur pat cu registre complet identice din punct de vedere funcțional În același timp, unele dintre ele sunt similare în unele dintre caracteristicile lor și, prin urmare, sunt împărțite în mai multe grupuri, ceea ce este prezentat și în Fig LA Vom discuta acum despre aceste grupuri Registre de uz general Registrele AX, BX, CX și DX fac parte din grupul de registre de uz general Primul registru din acest grup, AX, se numește registru sumator Este folosit pentru a acumula rezultatele calculelor și adesea acționează ca un receptor al rezultatelor executării diferitelor comenzi Deși fiecare registru este capabil să îndeplinească multe sarcini diferite, rezultatele executării unor instrucțiuni (în special, instrucțiuni de multiplicare) sunt trimise implicit registrului AX Al doilea registru al acestui grup, BX, se numește registru de bază Prin programare, este în multe privințe similar cu registrul AX, dar există o diferență semnificativă În BX, puteți scrie o adresă de memorie și apoi executați o instrucțiune al cărei operand se află la această adresă de memorie Cu alte cuvinte, BX poate conține un pointer către o zonă de memorie, dar AX nu Pentru a ilustra această afirmație, să comparăm două comenzi Prima echipa: moѵ AX, BX Această comandă copiază conținutul BX în AX A doua comanda: MOV AHDVH) Această instrucțiune copiază în AX conținutul cuvântului de memorie a cărui adresă este conținută în BX În primul exemplu, operandul sursă este conținut în registrul BX; al doilea exemplu conține un pointer către operandul sursă În ambele exemple, după cum puteți vedea, ambii operanzi sunt specificați pentru instrucțiunea mo: sursă (sursă) și țintă (destinație) În acest caz, operandul țintă este specificat înaintea sursei Următorul registru de uz general, CX, se numește registru de contor Printre altele, este folosit pentru a stoca valorile contorului în timpul execuției buclei În timpul procesării instrucțiunii LOOP, valoarea din acest registru este automat decrementată cu unu De regulă, ciclurile se termină în momentul în care valoarea din registrul CX ajunge la zero Al patrulea registru din grupul de registre de uz general este registrul de date (DX) Împreună cu registrul AX, este utilizat la executarea comenzilor cu cuvinte cu lungime dublă ( de biți) În acest caz, cei biți superiori sunt stocați în DX, iar cei biți inferiori sunt stocați în AX Aici trebuie să facem o rezervare care de obicei numerele întregi de de biți sunt numite lungi Termenul dublu este folosit mai frecvent pentru valorile în virgulă mobilă pe de biți, dar uneori este folosit și pentru a se referi la valori întregi pe de biți În contextul nostru, nu va exista confuzie, deoarece nu vom discuta despre numerele în virgulă mobilă Fiecare registru de uz general poate fi văzut fie ca un singur registru de biți, fie ca o pereche de registre de biți Astfel, procesorul are opt registre de biți care sunt folosite la executarea instrucțiunilor cu octeți și caractere Registrele incluse în toate celelalte grupuri nu pot fi împărțite în două părți pe biți Unele comenzi folosesc întregul registru (de exemplu, AX), altele doar o parte a acestuia (de exemplu, AL sau AH) Ca regulă generală, acele instrucțiuni care efectuează operații aritmetice folosesc de obicei registre întregi de biți, în timp ce cele care se ocupă de caractere se mulțumesc cel mai adesea cu registre de biți Trebuie avut în vedere că AL și AH nu sunt altceva* decât numele celor două jumătăți ale registrului AX Când un nou număr de biți este scris în AX, jumătățile sale inferioare și superioare sunt plasate în AL și, respectiv, AH Interacțiunea registrelor AX, AH și AL poate fi ilustrată prin următoarea comandă: MOV AX, Încarcă în registrul AX valoarea zecimală Când această instrucțiune se completează, valoarea se află în registrul octet AH, iar valoarea este în registrul octet * AL Lăsați această comandă să fie urmată de alta: ADDB AN,AI În acest caz, valoarea AL (adică ) este adăugată la valoarea registrului de octeți AH, iar valoarea rezultată devine Ca urmare a acestei operații, o nouă valoare este scrisă în registrul AX - , echivalent cu valoarea în sistemul numeric binar sau cu valoarea x x în sistemul numeric hexazecimal De regulă, două registre de octeți sunt interschimbabile Singura excepție este instrucțiunea MULB, în timpul execuției căreia unul dintre operanzi este întotdeauna stocat în registrul AL, care, împreună cu AH, este receptorul în acest caz La executarea instrucțiunii DIVB, dividendul este stocat în parurile* ale registrelor AH și AL Octetul inferior al contorului-registru CL este folosit pentru a stoca numărul de cicluri la executarea instrucțiunilor de schimbare normală și ciclică Al doilea exemplu din secțiunea Exemple (acest exemplu este din programul GenReg s) arată unele proprietăți ale registrelor generale Registre -pointere Al doilea grup de registre conține registre pointer și registre index Cel mai important registru din acest grup este stack pointer (SP) Stivele joacă un rol important în majoritatea limbajelor de programare Stiva este un segment de memorie care stochează unele date asociate * cu contextul programului executabil În mod obișnuit, atunci când o procedură este apelată, o porțiune a stivei este rezervată pentru a-și stoca variabilele locale, adresa la care se va întoarce când procedura se termină și o serie de alte date de control Partea stivei asociată cu execuția unei proceduri se numește cadru stivă Când o procedură apelată anterior apelează o altă procedură, este alocat un cadru de stivă suplimentar, care este de obicei plasat imediat sub primul În consecință, atunci când toate procedurile ulterioare sunt apelate, noi cadre de stivă sunt alocate pentru fiecare dintre ele în ordine descrescătoare Nu întotdeauna, dar în cele mai multe cazuri, stivele cresc în ordine descrescătoare - de la adrese mari la cele mai mici Cu toate acestea, partea de sus a stivei se numește cea mai mică adresă Pe lângă variabilele locale, stivele stochează rezultatele temporare ale execuției Procesorul are o instrucțiune push care împinge un cuvânt de biți în partea de sus a stivei Pentru a face acest lucru, mai întâi decrește valoarea registrului SP cu și apoi își stochează operandul la adresa către care indică acest registru după actualizare Instrucțiunea POP elimină cuvintele de biți din partea de sus a stivei în același mod - selectează valoarea situată în acest vârf și adaugă un doi la conținutul registrului SP Registrul SP, care indică partea de sus a stivei, poate fi schimbat cu comenzile PUSH, POP și CALL; in acelasi timp, push si CALL ii scade valoarea, in timp ce POP, dimpotriva, o creste Următorul registru din acest grup se numește indicatorul de bază (BP) De obicei, o adresă de pe stivă este scrisă în ea Spre deosebire de SP, care indică întotdeauna spre vârful stivei, BP poate indica oriunde pe stivă Cea mai obișnuită utilizare a registrului BP este de a indica începutul cadrului de stivă a procedurii curente; aceasta simplifică sarcina de a găsi variabilele locale Astfel, BP indică adesea spre partea de jos a cadrului stivei curent (cu alte cuvinte, către cuvântul din cadrul stivei cu cea mai mică valoare numerică), iar SP spre partea de sus (cuvântul din cadrul stivei cu cea mai mare valoare numerică ) Prin urmare, limitele cadrului actual al stivei sunt determinate de valorile registrelor pointerului BP și SP Acest grup are două registre de index: SI (Index sursă) și Dl (Index de destinație) În combinație cu VR, aceste registre sunt adesea folosite pentru a adresa date de pe stivă și, în combinație cu BX, pentru a calcula adresele de memorie Vom vorbi mai multe despre utilizarea acestor registre în secțiunea despre modurile de adresare Unul dintre cele mai importante registre, constituind un grup autosuficient, se numește indicatorul de instrucțiuni - așa numește Intel contorul de programe (PC) Instrucțiunile se referă la acesta pentru adresele segmentelor de cod din memorie Ciclul de execuție a instrucțiunii de către procesor începe cu preluarea instrucțiunii indicate de registrul PC Înainte de a executa comenzile ulterioare ale ciclului, se adaugă una la valoarea acestui registru Astfel, contorul de programe indică întotdeauna prima instrucțiune după cea curentă Registrul de pavilion, sau registrul de cod de condiție, este în esență un întreg set de registre, câte un bit: + Z — rezultat zero; + S - rezultat negativ (bit de semn); + V - rezultatul a generat un overflow; + C - rezultatul a generat un transfer; + A - transport de serviciu (de la bit ); + P este paritatea rezultatului Ceilalți biți din acest registru controlează diferite aspecte ale funcționării procesorului În special, bitul I activează întreruperi, iar bitul T activează modul de urmărire, care este utilizat pentru depanarea programelor În cele din urmă, bitul D controlează direcția operațiilor cu șir Nu toți cei biți ai registrului flag sunt utilizați; biții neutilizați au o valoare fixă de zero Patru registre sunt alocate grupului de registre de segmente După cum știți, stiva, datele* și codurile de instrucțiuni sunt stocate în diferite zone ale memoriei principale Registrele de segmente combină aceste zone de stocare, numite segmente Registrele de segment includ registrul de segment de cod (CS), registrul de segment de date (DS), registrul de segment de stivă (SS) și registrul de segment extins (ES) De cele mai multe ori, valorile lor rămân neschimbate De fapt, segmentul de date și segmentul de stivă aparțin aceleiași zone de memorie, dar datele sunt stocate în partea de jos a acestui segment comun, iar stiva se află în partea de sus Vom discuta despre segmente mai detaliat în subsecțiunea „Organizarea și segmentele memoriei” din secțiunea „Memorie și adresare” Memorie și adresare Memoria procesorului este organizată destul de neobișnuit, ceea ce se explică prin combinația de memorie de megaoctet și registre de biți Cert este că într-o memorie cu o capacitate de MB sunt necesari de biți pentru a reprezenta o adresă Prin urmare, nu este posibil să stocați un pointer către un element de memorie într-un singur registru de biți Pentru a rezolva problema, memoria este împărțită în segmente de KB fiecare, iar adresele din aceste segmente se încadrează în biți În continuare, ne vom uita la arhitectura memoriei mai detaliat Organizarea și segmentele memoriei Memoria procesorului , care constă dintr-o matrice de octeți adresabili de biți, este folosită pentru a stoca comenzi, date și stiva Pentru a separa zonele de memorie utilizate în scopuri diferite, procesorul introduce conceptul de segmente, care sunt blocuri de memorie separate unele de altele Un astfel de segment în este format din de octeți consecutivi Există patru segmente în total: cod, date, stivă și suplimentar Segmentul de cod conține comenzile care alcătuiesc programele Conținutul registrului PC este întotdeauna interpretat ca adresa unui segment de cod din memorie Valoarea zero a PC-ului nu indică adresa zero absolută din memorie, ci cea mai mică adresă din segmentul de cod dat Segmentul de date stochează date de program inițializate și neinițializate Dacă registrul BX conține un pointer, acesta trebuie să indice segmentul de date Segmentul de stivă conține variabile locale și rezultate intermediare împinse pe stivă Adresele specificate în registrele SP și BP se referă întotdeauna la segmentul de stivă Segmentul suplimentar este un registru de segment auxiliar care poate fi plasat oriunde în memorie, după cum este necesar Fiecare dintre aceste segmente corespunde unuia dintre registrele de segmente de biți CS, DS, SS și ES Adresa de pornire a unui segment este un întreg fără semn de de biți format prin deplasarea registrului de segment cu biți la stânga și plasarea a patru zerouri în cele patru poziții libere la dreapta Prin urmare, registrele de segment dintr-un spațiu de adrese de de biți sunt întotdeauna exprimate ca multipli de registrul de segmente nr indică baza segmentului Adresele de segment sunt formate prin conversia unei valori de biți din registrul de segment într-o adresă reală de de biți prin adăugarea a patru biți zero la sfârșitul valorii și efectuând o compensare În cele din urmă, adresa absolută din memorie este setată prin înmulțirea valorii din registrul de segment cu și adăugarea offset-ului De exemplu, dacă valoarea lui DS este și BX este , atunci BX indică adresa x + = Cu alte cuvinte, pe baza valorii lui din registrul DS, puteți obține de biți adresa binară Adăugând la valoarea inițială a segmentului offset de biți (zecimal ), obținem adresa de de biți (decimal) De fiecare dată când se accesează memoria, unul dintre registrele de segment este folosit pentru a forma adresa reală a memoriei Dacă o instrucțiune conține o adresă imediată fără nicio indicație a unui registru, acea adresă este considerată a fi în segmentul de date, iar registrul DS este utilizat pentru a determina baza acelui segment Adresa fizică este determinată prin adăugarea rezultatului operației anterioare la adresa specificată în comandă Adresa fizică din memoria de cod a următoarei instrucțiuni este setată prin deplasarea conținutului registrului CS cu patru biți și adăugarea la valoarea contorului programului Cu alte cuvinte, adresa reală de de biți este mai întâi calculată din valoarea registrului CS de biți, apoi se adaugă noua valoare de biți a PC-ului; rezultatul este o adresă absolută de de biți în memorie Segmentul de stivă este format din cuvinte de octeți, ceea ce înseamnă că doar un număr par poate fi stocat în indicatorul de stivă (SP) Stiva se umple în ordine de la cea mai mare adresă la cea mai mică Astfel, instrucțiunea PUSH decrește indicatorul stivei cu și apoi stochează operandul la adresa de memorie calculată din valorile SS și SP Instrucțiunea POP preia valoarea primită după executarea operației PUSH și incrementează valoarea SP cu Acele adrese din segmentul de stivă care sunt sub limita determinată de registrul SP sunt considerate libere Prin urmare, curățarea stivei se face doar prin creșterea SP În practică, valorile registrelor DS și SS sunt întotdeauna aceleași, așa că un pointer de biți este suficient pentru a accesa o variabilă din segmentul comun de date și stivă Dacă valorile registrelor DS și SS ar fi diferite, la fiecare pointer ar trebui adăugat un al -lea bit - singura modalitate de a face distincția între pointerii către segmentul de date și către segmentul stivă În general, crearea unui segment separat de stivă de către dezvoltatorii de cipuri cu greu poate fi considerată justificată Dacă adresele din cele patru registre de segmente sunt îndepărtate, segmentele sunt împărțite, dar având în vedere cantitatea limitată de memorie disponibilă, nu este necesară divizarea acestora Cantitatea de cod de program după compilare este necunoscută Prin urmare, cel mai eficient este să plasați granița inițială a segmentului de date și a segmentului de stivă primul multiplu de după ultima comandă Această decizie implică faptul că segmentul de cod și segmentul de date nu vor folosi în niciun caz aceeași adresă fizică Adresarea Executarea marii majorități a comenzilor necesită date care sunt preluate fie din memorie, fie din registre oferă mai multe moduri de adresare pentru denumirea acestor date Multe instrucțiuni (' fiecare are doi operanzi, care în acest caz se numesc de obicei sursă (sursă) și țintă (destinație) Să luăm copia și să adăugăm instrucțiuni ca exemplu: moѵ AX, BX ADD CX, Primii operanzi din aceste instrucțiuni sunt destinațiile, iar al doilea operanzi sunt sursele (Ordinea lor nu este fundamentală; ar putea la fel de bine să fie inversată ) Evident, în acest caz, destinația este valoarea din stânga, adică valoarea suprascrisă ar trebui să fie situată în acest loc Prin urmare, operanzii țintă, spre deosebire de cei sursă, nu pot fi constante În versiunea originală a arhitecturii , unul dintre operanzi, dacă *, dacă există doi dintre ei în instrucțiune, trebuie să fi fost un registru Această cerință trebuia să facă distincția între instrucțiunile de procesare de octeți și de text pe baza faptului că registrul adresat este un registru de octeți sau un registru de cuvinte În prima versiune a procesorului, această regulă a fost respectată cu o strictețe incredibilă Nici măcar nu a fost posibil să se împingă o constantă pe stivă, deoarece în acest caz, nu ar exista niciun registru în niciunul dintre cei doi operanzi ai instrucțiunii În versiunile ulterioare, restricțiile au fost relaxate, dar principiul în sine a avut un anumit impact asupra designului procesorului În unele cazuri, unul dintre cei doi operanzi nu este menționat De exemplu, în instrucțiunea MULB, doar registrul AX poate juca rolul receptorului Există, de asemenea, instrucțiuni cu un singur operand Această categorie include, dar nu se limitează la, comenzi de creștere, schimbare și resetare În aceste instrucțiuni, cerința de a utiliza un registru ca operand nu se aplică și puteți distinge între instrucțiuni de procesare a textului și octet numai prin codurile de operare (adică tipuri de instrucțiuni) Procesorul acceptă patru tipuri de date de bază: octet, cuvânt ( octeți), cuvânt lung ( octeți) și BCD, care împachetează două cifre zecimale într-un cuvânt Ultimul tip nu este acceptat de interpret O adresă de memorie corespunde întotdeauna unui octet, dar în cazul unui cuvânt obișnuit sau lung, există și o referire implicită la locațiile de memorie imediat deasupra octetului specificat De exemplu, cuvântul de la adresa ocupă locațiile de memorie și Cuvântul lung de la adresa ocupă locațiile de memorie - Procesorul este un sistem little endian; aceasta înseamnă că partea inferioară a cuvântului este stocată la adresa cea mai joasă Într-un segment de stivă, cuvintele trebuie plasate la adrese egale Combinația AX DX, în care AX conține un cuvânt de ordin mai mic, este singura opțiune posibilă pentru plasarea cuvintelor lungi în registrele procesorului Yu Aplicație c Programare în limbaj de asamblare În tabel B arată toate modurile de adresare furnizate în În cele ce urmează, le vom analiza pe scurt Rândurile superioare ale tabelului listează registre, care pot fi folosite ca surse sau receptori în aproape toate comenzile Există registre pentru cuvinte și același număr pentru octeți Tabelul B Moduri de adresare a operanzilor (simbolul # înseamnă valoare numerică sau etichetă) • Modul de adresare Exemple de operanzi înregistrează adresarea Io înregistrare pentru octeți Înregistrare pentru octeți AH, AL, BH, BL, CH, CL, DH, DL Io registru pentru cuvinte Registrul pentru cuvinte AX, BX, CX, DX, SP, BP, SI, DI adresarea segmentelor de date Adresă directă Adresă după cod operațional (#) registru indirect D|x?sation Adresă în registru (SI), (DI), (BX) 'adresare de registru cu offset Adresarea registrului index Adresa se formează prin adăugarea BX cu SI/DI (BX)(SI) (BX)(DI) Adresarea registrului index cu offset BX plus SI DI plus offset #(BX)(SI), #(BX)(DI) Stack Segment Addressing adresare indirectă către indicatorul de bază Adresă în registru (VR) 'pointer paving iasa Apelarea indicatorului iasia cu index Adresa se formează prin adăugarea BP și SI/DI (BP)(SI), (BP)(DI) /indice de pavaj uka-ia gel bază BP plus SI/DI plus offset #(BP)(SI), #(BP)(D ) Adresarea directă a datelor Despre direct >articol/cuvânt Parte informațională a comenzii # Adresarea implicită Comandă Push/Pop Adresă indirectă (SP) PUSH, POP, PUSHF, POPF Modul de adresare Încărcare sau stocare steaguri Registrul de operanzi cu steaguri de stare Exemple LAHF, STC, ss CMC Difuzați XLAT AL, BX XLAT Comenzi șir repetate (SI), (DI), (CX) MOVS, CMPS, SCAS Comenzi de intrare și ieșire AX, AL IN #, OUT # Conversie octet, cuvânt AL, AX, DX CBW, CWD * Rândurile de sub titlul „Adresarea segmentului de date” listează modurile de adresare care sunt relevante pentru segmentele de date Adresele de acest tip sunt întotdeauna incluse într-o pereche de paranteze - vă permit să distingeți adresa din compoziția lor de o valoare de alt tip Cel mai simplu mod de adresare din această categorie este adresarea directă, în care adresa datelor operandului este inclusă în instrucțiune Exemplu: ADAUGĂ CX,( ) În acest caz, la registrul CX se adaugă conținutul cuvântului de memorie situat la adresele și În limbajul de asamblare, celulele sunt de obicei exprimate ca etichete, nu ca valori numerice, iar conversia este deja efectuată în timpul asamblarii Chiar și în instrucțiunile CALL și JMP, operandul țintă poate fi stocat în locația de memorie indicată de etichetă Parantezele din jurul etichetelor sunt absolut necesare (cel puțin pentru asamblatorul despre care vorbim), întrucât următoarea comandă are și dreptul de a exista: ADAUGĂ СХ, Totuși, această comandă exprimă o operațiune complet diferită și anume, adăugarea constantei la valoarea registrului CX, și nu conținutul cuvântului de memorie situat la adresa Simbolul # în Tabel B poate desemna o constantă numerică, o etichetă sau o expresie constantă etichetată La adresarea indirectă a registrului, adresa operandului este stocată într-unul din cele trei registre: BX, SI sau DL În toate aceste cazuri, ajunge în segmentul de date De asemenea, este posibil să plasați o constantă înaintea unui registru, caz în care adresa este setată prin adăugarea registrului la constantă Acest tip de adresare, numită adresare de registru deplasat, este utilă atunci când se lucrează cu matrice Deci, dacă registrul SI conține valoarea , atunci al cincilea caracter al șirului identificat de eticheta FORMAT poate fi încărcat în registrul AL folosind instrucțiunea: MOVB AL,FORMAT(SI) În acest caz, întreaga linie este vizualizată în fiecare etapă printr-o creștere pozitivă sau negativă a valorii registrului Când folosiți operanzi-cuvinte, valoarea registrului se modifică de fiecare dată într-o direcție sau alta cu De asemenea, este posibil să plasați baza (adică adresa numerică de jos) a matricei în registrul BX, păstrând registrele SI sau DI pentru referință Această schemă se numește adresarea registrului index Exemplu: PUSH (BX)(DI) Acest cod preia conținutul unei celule dintr-un segment de date cu o adresă care este determinată de suma registrelor BX și DI Valoarea rezultată este apoi împinsă pe stivă Combinația ultimelor două tipuri de adresare are ca rezultat adresarea registrului indexat cu un offset: NU (BX)(DI) Această instrucțiune accesează cuvântul de memorie la adresele BX + DI + și BX + DI + Toate metodele de adresare indirectă aplicabile segmentului de date sunt relevante și pentru segmentul de stivă; în acest din urmă caz, registrul de bază BX este înlocuit cu indicatorul de bază BP Astfel, (BP) este doar un mod de adresare indirectă a stivei de registre, dar există moduri mai complexe, în special, adresare indirectă prin indicator de bază cu index și offset: - (BP) (SI) Aceste moduri sunt utile atunci când accesați variabilele locale și parametrii funcției stocați la adresele stivei din subrutine Corespondentul („chima” este descris în subsecțiunea Apeluri subrutine Toate adresele corespunzătoare modurilor de adresare enumerate pot acționa atât ca surse, cât și ca destinații în operațiuni Luate împreună, aceste două categorii sunt numite adrese valide Modurile de adresare ale celor două categorii rămase nu presupun prezența receptorilor, deci adresele corespunzătoare nu se numără printre cele valabile Sunt folosite doar ca surse Modul de adresare în care operandul este un octet constant sau o valoare de cuvânt se numește adresare imediată De exemplu: DOMNUL AH, Această instrucțiune compară valoarea din registrul AX cu constanta și setează biții din registrul flag în funcție de rezultat În cele din urmă, unele comenzi folosesc adresare implicită În astfel de instrucțiuni, operandul sau operanzii sunt doar implicite De exemplu: împinge AH Această instrucțiune împinge conținutul registrului AX în stivă; pentru a face acest lucru, scade valoarea lui SP cu unul și apoi copiază conținutul lui AX în celula către care SP indică acum În acest caz, registrul SP nu este menționat în comandă De asemenea, registrul steagului de stare nu este menționat în instrucțiunile de control al pavilionului Operanzii impliciti sunt folosiți și în alte instrucțiuni Procesorul oferă instrucțiuni speciale pentru mutarea (MOVS), compararea (CMPS) și răsfoirea șirurilor (SCAS) După executarea acestor comenzi șir, conținutul registrelor de index SI și DI este actualizat automat Acest mecanism se numește, în funcție de direcție, modul auto-incrementare sau auto-decrementare Direcția de creștere (pozitivă sau negativă) a registrelor SI și DI este determinată de indicatorul de direcție din registrul de indicatori de stare Un steag de direcție cu o valoare de zero indică o creștere pozitivă, iar un steag cu o valoare de unu determină o creștere negativă Valoare incrementul este de în instrucțiuni de octet și de în instrucțiuni de cuvânt Într-un fel, indicatorul de stivă este legat și de modurile de auto-increment și auto-decrement: valoarea sa este decrementată cu la începutul operațiunii PUSH și incrementată cu la sfârșitul operațiunii POP Setul de comenzi Orice computer se caracterizează, în primul rând, prin setul de comenzi pe care este capabil să le execute Pentru a înțelege cum funcționează un computer, este necesar să-i studiezi în detaliu setul de instrucțiuni În această secțiune, vom discuta despre cele mai* importante comenzi Unele dintre aceste comenzi sunt prezentate în Tabelul B , unde sunt împărțiți în grupe Tabelul B Unele dintre cele mai importante instrucțiuni din procesorul Mnemonic Descriere Operanzi Indicatori de stare Despre SZ cu MOV(B) Mutare cuvânt, octet r*-e, e'-r, e -# — — — XCHG(B) Schimb de cuvinte r*->e — — — — LEA Încarcă adresa validă r"-#e — — — — PUSH Introducere în stiva e, # — — H" — POP Popping e — — — — PUSHF Introducere în stiva de steaguri — — — — — Steaguri pop POPF - - - - - XLAT Broadcast AL — — — — — ADD(B) Adăugarea cuvântului r "-e, e "-r, e * - # * * * * ADC(B) Adăugarea unui cuvânt cu un transfer r "-e, e "-r, e -# * * * * SUB(B) Scăderea cuvântului r*-e, e'-r, e -# * * * ♦ SBB(B) Scădere cuvânt cu purtare negativă r*-e, e*-r, e -# * * * * IMUL(B) Înmulțire semnată e * u u * MUL(B) Înmulțire fără semn e * u u * IDIV(B) Diviziune în funcție de semne e u u u DIV(B) Diviziune fără semn continuare & Anexa B Programare în limbaj de asamblare Tabelul B (continuare) Mnemonic Descriere Operanzi Indicatori de stare Despre SZ cu CBW Octet la cuvânt ajustat în funcție de semn — — — — — CWD Semn ajustat de la cuvânt la cuvânt dublu — — — — NEG(B) Negarea numărului binar e * ♦ * * NOT(B) Negație logică e — — — — INC(B) Creștere pozitivă la adresa de destinație e * * * — DEC(B) Creștere negativă la adresa de destinație e * * * — ȘI(B) ȘI logic e*-r, r"~e, e"-# * * ()R(B) SAU logic e'-r, r r, e"-►# * * CMP(B) Compara operanzi e Etichetă — — — LOOPZ LOOPE Salt înapoi dacă Z = și DEC(CX) > Etichetă — — — — LOOPNZ LOOPNE Salt înapoi dacă Z = și DEC(CX) > Etichetă — — — — REP REPZ REPNZ Repetare șir de comandă șir de comandă — — — — MOVS(B) Mută șirul c^s — — — — — LODS(B) Încarcă șirul de cuvinte — — — — — STOS(B) Stocare șir de cuvinte — — — — - SCAS(B) Vedeți șirul de cuvinte - * * * * Comparație șiruri de cuvinte CMPS(B) - * * * * Etichetă de ramură condiționată JCC — — — — JMP Salt la eticheta e, label — — — — CALL Salt la subrutina e, etichetă — — — — RET Întoarcere din subrutină — — — — SYS Ridicați o excepție de sistem — — — — — Mutare, copiere și comenzi aritmetice Primul grup include comenzi de copiere și mutare Comanda moѵ, care specifică în mod explicit adresele sursă și destinație, este extrem de importantă Dacă adresa sursă este un registru, adresa de destinație poate fi validă În tabel B operanzii de registru sunt notați prin simbolul r, iar adresele reale - prin simbolul e În consecință, combinația în cauză arată ca e*~k Această denumire este cea care vine prima în celula operanzilor mo instrucție Deoarece sintaxa instrucțiunii necesită ca adresa de destinație să fie primul operand și adresa sursă să fie a doua, caracterul săgeată spre stânga ("-") este folosit pentru a desemna operanzii Astfel, scriere înseamnă că conținutul registrului este copiat la adresa reală De asemenea, într-o instrucțiune MOV, adresa reală poate fi adresa sursă și registrul adresa de destinație Această situație este notată cu r*-e (aceasta este a doua intrare din celula de operand a instrucțiunii menționate) A treia opțiune este că datele în sine sunt situate la adresa sursă, iar adresa de destinație este validă, care este exprimată ca e" - # Datele directe din tabel sunt indicate prin simbol wv i irilozhomie o i irigrammiroiniѳ în Assemolera semnele hash (#) Simbolul „B” între paranteze la sfârșitul codului mnemonic este destinat să acceseze cu crawlere că există comenzi pentru mutarea unui cuvânt (moѵ) și a unui octet (mov) Astfel, această linie din tabel descrie de fapt șase comenzi diferite Niciunul dintre steagurile din registrul codului de condiție nu se modifică în funcție de finalizarea comenzii de mutare și, prin urmare, în ultimele patru coloane este afișată o liniuță (-) Rețineți că comenzile de mutare nu mută deloc datele Ei creează copii fără a modifica datele originale, ceea ce este diferența față de operația tradițională de mutare A doua comandă prezentată în acest tabel este XCHG Schimbă registrul rezervat și adresa reală Simbolul săgeată dublă ( lag este setat dacă rezultatul nu poate fi exprimat cu suficientă acuratețe în numărul permis de biți și este resetat dacă există această posibilitate De exemplu, atunci când se adaugă numărul maxim permis de biți x fff ( în zecimală) la sine, rezultatul nu poate fi exprimat ca un număr de biți cu semn, caz în care indicatorul O este setat să indice o eroare alte steaguri de stare Dacă comanda este capabilă să influențeze steag de stare, această circumstanță este indicată printr-o cursă (*) în coloana corespunzătoare În instrucțiunile ADC și SBB, indicatorul de transport la începutul operațiunii este setat la rolul unei unități suplimentare (sau glonț) care exprimă un report pozitiv sau negativ dintr-o operațiune anterioară Această caracteristică este utilă în special pentru reprezentarea valorilor întregi de de biți și mai mari în mai multe cuvinte Pe lângă cele de mai sus, există și operații de adunare și scădere de octeți Următorul bloc al tabelului conține comenzile de înmulțire și împărțire Operanzii întregi semnat necesită instrucțiunile IMUL și IDIV; pentru a gestiona valori fără semn, comenzile MUL și DIV sunt suficiente În versiunile de octeți ale acestor comenzi, combinația de registre AH : AL este implicit luată ca adresă țintă În instrucțiunile de procesare a textului, adresa țintă implicită este combinația de registru AX : DX Chiar dacă rezultatul înmulțirii este un cuvânt sau un octet, valoarea registrului DX sau AX este actualizată ” Nu există înmulțiri nevalide, deoarece nu există lipsă de biți la adresa țintă Biții de depășire și de transport sunt setați atunci când produsul nu poate fi reprezentat printr-un cuvânt sau un octet Steagurile zero și negative sunt nedefinite după înmulțire La împărțire, aceleași combinații de registre sunt folosite ca adrese țintă: DX : AX sau AH : AL Coeficientul este scris în AX sau AL, iar restul în DX sau AN Toate cele patru steaguri - carry, overflow, zero și negativity - sunt transferate într-o stare nedeterminată după efectuarea operației de divizare Cu un divizor zero și, de asemenea, în cazul în care coeficientul nu se încadrează în registru, se inițiază o excepție, iar dacă procedura de interceptare a excepțiilor în program nu este prevăzută, programul se oprește Mai mult, este dificil să manevrezi programatic semnele minus înainte sau după o operație de împărțire, deoarece conform specificației , semnul restului trebuie să fie întotdeauna egal cu semnul dividendului, în timp ce în matematică este doar un rest nenegativ permis Comenzile pentru procesarea numerelor binare-zecimale, inclusiv comenzile de corectare înainte de adăugarea caracterelor ASCII (ADA) și a valorilor zecimale (daa), nu sunt implementate în interpret și nu sunt prezentate în tabel LA Operații booleene, operații pe biți și operațiuni în schimburi Următorul grup conține comenzi pentru extinderea semnelor, negație, negație logică, incremente pozitive și negative Operațiile de extensie a semnelor care nu au operanzi explici operează pe combinații de registre DX : AX sau AH : AL Pentru toate celelalte operațiuni din acest grup, operanzii (singuri) pot fi localizați la orice adresă validă Execuția operațiunilor NEG, INC și DEC determină starea steagurilor în mod standard, dar indicatorul de transport nu este modificat prin incremente negative și pozitive Unii experți consideră această ultimă împrejurare ciudată o eroare de proiectare Următorul grup de instrucțiuni conține instrucțiuni logice cu doi operanzi Toate sunt executate într-un mod standard În grupul de comenzi de schimbare normală și ciclică, toate operațiunile au adrese reale ca adrese țintă cerere c programare în limbaj de asamblare adrese; adresa sursă este reprezentată ca* registrul de octeți CL sau unul Executarea operațiunilor de schimb afectează toate cele patru steaguri; deplasările ciclice pot schimba doar steaguri de transport și depășire După o schimbare normală sau ciclică, bitul transferat poate fi ridicat sau scăzut, în funcție de direcția deplasării normale sau ciclice Când se efectuează o rotație de transportare cu instrucțiunile RCR, RCL, RCRB și RCLB, combinația dintre un transport și un operand situat la o adresă reală formează o combinație de biți sau biți de registre de rotație care simplifică cele normale și cu mai multe cuvinte rotatii Comenzile incluse în următorul grup sunt folosite pentru a controla biții de semnalizare Practic, sunt necesare pentru a se pregăti pentru sărituri condiționate Săgeata cu două capete ( în VW i ilizemie d și programare în limbaj de asamblare Tabelul B (continuare) Wildcard Descriere \|> Spațiu \f Flux de pagină \r Retur carucior \II ghilimele duble Pseudo-comanda SPACE incrementează valoarea indicatorului de adresă cu numărul de octeți specificat de argumente Acest cuvânt cheie poate fi util în special dacă este stabilit după o etichetă într-o secțiune BSS pentru a rezerva memorie pentru o variabilă Cuvântul cheie ALIGN vă permite să avansați indicatorul de adresă la prima limită de , sau octeți din memorie, ceea ce facilitează asamblarea cuvintelor, cuvintelor duble etc în locații de memorie adecvate În cele din urmă, cuvântul cheie EXTERN declară că programul specificat sau locația de memorie este disponibilă pentru linker pentru a configura referințe externe Definiția nu trebuie să fie în fișierul curent; poate fi oriunde la îndemâna linkerului Ar trebui făcute o serie de observații cu privire la utilizarea în comun a asamblatorului și trasorului Asamblatorul acceptă cuvinte cheie atât în litere mari, cât și în minuscule; trasorul le scoate numai cu litere mari Asamblatorul acceptă caracterele de înlocuire \r (întoarcerea căruciorului) și \n (avans de linie) ca caracter de nouă linie, în timp ce urmăritorul îl folosește doar pe acesta din urmă Asamblatorul este capabil să lucreze cu programe împărțite în mai multe fișiere, în timp ce pentru a fi procesat în tracer, întregul program trebuie să fie combinat într-un fișier cu extensia $ Fișierele incluse în acesta sunt solicitate de comandă ♦include numele fișierului În acest caz, fișierul inclus trebuie să fie, de asemenea, localizat în poziția specificată într-un singur fișier $ Asamblatorul verifică dacă fișierul include dat a fost procesat înainte și încarcă o copie a acestuia Această caracteristică este utilă în special atunci când un fișier antet este partajat de mai multe fișiere Într-o astfel de situație, numai o copie a fișierului |) este inclusă în fișierul sursă îmbinat Pentru a include un fișier, comanda #include trebuie să fie primul simbol al liniei fără delimitatori precedați, iar calea către fișier trebuie să fie cuprinsă între ghilimele duble Dacă există un singur fișier sursă (de exemplu, pr s), se presupune că mspem al proiectului sunt simboluri pr, iar fișierul combinat ar trebui să fie numit )r $ Dacă există mai multe fișiere sursă, numele primului dintre ele a fost luat ca nume al proiectului și este, de asemenea, folosit pentru a determina fișierul $, care este „operat de asamblator prin concatenarea fișierelor sursă Acest mecanism este schimbat în mod fals prin plasarea pe linia de comandă înaintea primului fișier sursă |miag -o projname; în acest caz, fișierul îmbinat se numește projname $ Rețineți că există o serie de condiții care se aplică la utilizarea fișierelor include și a fișierelor surse multiple |> În special, numele etichetelor, variabilelor și constantelor trebuie să fie diferite în toate fișierele sursă Mai mult, până la urmă cont, fișierul projname $ este asamblat în fișierul de boot, astfel încât numerele de linie indicate de asamblator atunci când sunt detectate erori și sunt afișate avertismente sunt numărate din acest fișier Când lucrați cu proiecte mici, este logic să scrieți programul într-un singur fișier, mai degrabă decât să utilizați comanda #include Câteva diferențe față de alți asamblori Asamblatorul as este modelat după asamblatorul standard UNIX și, prin urmare, diferă în anumite privințe de asamblatorul de macrocomandări Microsoft MASM și de asamblatorul Borland TASM Atât MASM cât și TASM au fost dezvoltate pentru sistemul de operare MS-DOS, iar legătura dintre sistemul de operare și asamblator este foarte clară în anumite aspecte MASM și TASM acceptă toate modelele de memorie acceptate de MS-DOS De exemplu, ele oferă un model de memorie în miniatură, în care tot codul și toate datele luate împreună trebuie să se încadreze în KB, un model mic, în care sunt alocați KB pentru fiecare dintre aceste segmente și un model mare, care permite coduri multiple segmente și segmente de date Diferențele dintre aceste modele depind de modul în care sunt utilizate registrele de segmente În modelul mare, puteți efectua apeluri interurbane și puteți schimba registrul DS Procesorul însuși impune anumite restricții asupra registrelor de segment (de exemplu, registrul CS nu poate fi adresa țintă într-o instrucțiune mo) Pentru a simplifica trasarea, as folosește un model de memorie similar cu small, deși asamblatorul poate procesa registre de segment fără restricții suplimentare fără ajutorul unui trasor Cele două asamblatoare menționate mai sus nu au o secțiune BSS și inițializează memoria doar în secțiuni de date De obicei, codul limbajului de asamblare începe cu un antet într-o formă sau alta; apoi urmează secțiunea de date, notat cu cuvântul cheie data, după care textul programului este scris cu cuvântul cheie code Titlul folosește cuvintele cheie title (numele programului), model (model de memorie) și stack (alocare de memorie pentru segmentul de stivă) Dacă binarul țintă urmează să fie scris cu o extensie cell, se aplică modelul de memorie în miniatură; în acest caz, toate registrele de segment sunt egalizate, iar la începutul segmentului combinat, de octeți sunt rezervați pentru „prefixul segmentului de program” În loc de directivele WORD BYTE și ASCIZ, asamblatorii TASM și MASM folosesc cuvintele cheie DW (definiție cuvânt) și DB (definiție octet) Directiva DB poate fi urmată de o definiție de șir de ghilimele duble Colonele nu sunt folosite după etichete în definițiile datelor Blocurile mari de memorie sunt inițializate cu cuvântul cheie DUP; este precedat de numărul de octeți, iar după el este definită inițializarea De exemplu: LABEL DB DUP ( ) Această instrucțiune inițializează de octeți de memorie cu zero octeți ASCII la adresa LABEL Etichetele subrutinei nu sunt urmate de două puncte, ci de cuvântul cheie proc La sfârșitul subrutinei, această etichetă este duplicată, iar cheia este plasată după ea W « I rappppi | / iѵЯПІПВ PP XJOIKtJ UUUBMOJiepa Cuvântul ENDP, care permite asamblatorului să determine domeniul exact al subrutinei Etichetele locale nu sunt acceptate Cuvintele cheie utilizate cu comenzile sunt identice în MASM, TASM și as În plus, în instrucțiunile cu doi operanzi, operandul sursă este plasat după țintă Pe de altă parte, cel mai comun mod de a transmite argumente la funcții nu este pe stivă, ci pe registre Dacă, totuși, programele în limbaj de asamblare sunt inserate în programele C sau C++, stiva este de preferat deoarece este în concordanță cu mecanismul de apelare a subrutinei C Acest lucru nu este foarte important, deoarece în as stiva poate fi înlocuită cu registre Cea mai semnificativă diferență între MASM, TASM și as se rezumă la modul în care sunt efectuate apelurile de sistem În MASM și TASM se fac cu întreruperea sistemului INT Varianta sa cea mai comună este INT ін; este folosit pentru a efectua apeluri de sistem MS-DOS Numărul de apel este plasat în registrul AX (din nou, argumentele sunt transferate în registre) Dispozitivele diferite au vectori și numere de întrerupere diferiți, cum ar fi INT H pentru funcțiile tastaturii BIOS și INT H pentru afișaj Pentru a programa aceste funcții, programatorul trebuie să cunoască o cantitate imensă de date despre anumite dispozitive Apelurile de sistem UNIX implementate în as sunt mult mai simple trasor Tracerul/depanatorul în cauză este adaptat pentru un terminal convențional (VT ) x cu un set standard de comenzi ANSI pentru terminale Pe mașinile UNIX și Linux, emulatorul de terminal de pe sistemul X-window îndeplinește de obicei aceste cerințe Pe mașinile Windows, driverul ansi sys este încărcat cu fișierele de inițializare a sistemului în acest scop; a cărui procedură de descărcare va fi descrisă mai jos Am arătat deja structura ferestrei trasoare După cum se poate observa din fig B , ecranul de urmărire este împărțit în șapte secțiuni În partea stângă sus a ferestrei se află secțiunea procesor; în el, conținutul registrelor de uz general este indicat în reprezentare zecimală, toate celelalte registre - în hexazecimal Deoarece valoarea numerică a contorului programului nu este prea informativă, linia de mai jos determină poziția în codul sursă al programului în raport cu eticheta globală anterioară Cinci coduri de condiție sunt afișate deasupra câmpului contor de programe Un preaplin este indicat prin simbolul ѵ, un steag de direcție prin simbolul > (creștere) sau ) Adresele de retur subprogramelor sunt indicate printr-o cifră înaintea valorii hexazecimale Secțiunea din dreapta sus afișează partea din fișierul sursă care conține următoarea comandă în ordinea execuției Poziția contorului de programe, ca și poziția indicatorului stivei, este indicată printr-o săgeată (=>) Procesor cu registre Stack Program text Fișier sursă Câmp de ieșire eroare stivă de apeluri subrutine - Câmp de intrare Echipe câmpul de ieșire al interpretului Valorile variabilelor globale l Segment de date Orez LA Tracer secțiuni de fereastră Sub secțiunea procesor sunt ultimele puncte de apel ale subrutinei din codul sursă Chiar mai jos este secțiunea de comandă a trasorului, unde anterioară; comanda este în partea de sus, iar cursorul de comandă este în partea de jos Rețineți că fiecare comandă trebuie să fie terminată printr-un retur de cărucior (pe tastaturi; pe computere, aceasta se introduce prin apăsarea tastei Enter) Secțiunea inferioară poate conține șase elemente ale memoriei globale de date Fiecare astfel de element începe de la o poziție numărată de la una sau alta etichetă, urmată de o poziție absolută în segmentul dpi Apoi sunt plasați două puncte și sunt scoși octeți în ieșire hexazecimală Următoarele poziții AND sunt rezervate caracterelor care ar putea fi urmate de patru cuvinte în notație zecimală Octeții, caracterele și straturile reprezintă aceeași zonă de memorie, dar există trei octeți suplimentari pentru o expresie de caracter Această decizie se datorează faptului că inițial nu este clar sub ce formă vor fi prezentate datele: ca țintă de numere cu semn sau fără semn, sau ca șir Secțiunea din dreapta din mijloc este rezervată pentru intrare și ieșire Prima linie este urmată de * ieșirea erorilor de urmărire, a doua linie este ocupată de intrare, iar câteva dintre cele mai importante - ieșire Ieșirea de eroare este precedată de un E, intrarea de un / și ieșirea standard de un > În câmpul de introducere, o săgeată (->) indică următorul indicator în ordinea citirii Când apelați read sau getchar, introduceți următoarele pe linia de comandă a tracerului și expresia intră în câmpul de intrare În acest caz; trebuie să completați intrarea apăsând tasta Enter Partea momentan neprocesată a șirului este după săgeată (->) De obicei, un urmăritor citește comenzile și intrările dintr-un fișier dintr-o intrare pi În același timp, puteți pregăti un fișier cu comenzi de urmărire) și un fișier cu linii de intrare care vor fi citite înainte de a transfera controlul în fișierul de intrare standard Fișierele de comandă Tracer sunt salvate cu extensia, iar fișierele de intrare sunt salvate cu extensia i În limbajul de asamblare, cuvintele cheie, subrutinele stem și pseudo-instrucțiunile pot folosi simbolul atât majuscule cât și minuscule Procesul de asamblare creează un fișier $ în care cuvintele cheie cu litere mici sunt convertite în majuscule și returnările de transport sunt eliminate Cu acest sistem, fiecare proiect (să zicem că se numește pr) poate avea până la șase fișiere: Fișier cu cod sursă în limbaj de asamblare (pr s) Fișier cu codul sursă îmbinat (rg $) Descărcați fișierul (rg ) Fișier de intrare standard presetat (pr i) Fișier preinstalat cu comenzi de urmărire (pr t) Fișier pentru conectarea codului în limbaj de asamblare cu fișierul de descărcare (pr #) Tracerul umple secțiunea din dreapta sus a ferestrei și câmpul contorului programului cu conținutul ultimului fișier În plus, urmăritorul verifică când a fost creat fișierul de descărcare: înainte de ultima modificare a codului sursă al programului sau după; în primul caz, se generează un avertisment Comenzi Tracer Comenzile de urmărire sunt listate în tabel LA Cele mai importante dintre ele sunt comanda de returnare unică (prima linie a tabelului), care execută o instrucțiune de procesor și comanda q exit (linia de jos a tabelului) Numărul ca nume de instrucțiune indică numărul de instrucțiuni de procesor pregătite pentru execuție Astfel, numărul k este echivalent cu repetarea ^-fold a comenzii return Un efect similar se obține dacă numărul este urmat de un semn de exclamare (!) sau de simbolul X Tabelul B Tracer Commands Adresă Comanda Exemplu Descriere Executarea unei comenzi #,! ,X Executarea comenzilor # /t +# g , /start + g Rulați la linia # după T /m +# ъ /start + b Plasează punctul de întrerupere pe linia # după T /t +# s /start + c Eliminați punctul de întrerupere din linia # după T # g g Execuția programului până la rândul # gg Executați programul până când se ajunge din nou la linia curentă bb Plasați un punct de întrerupere pe linia curentă c c Eliminați punctul de întrerupere din linia curentă nn Executați programul la linia următoare d d Execuție până la punctul de control sau până la capăt iraooor Adresă Comanda Exemplu Descriere = * Programul rulează la același nivel de subrutină - - Rulați la nivelul subrutinei minus - - + Rulați la nivelul subrutinei plus /D +# /buf + Afișează segmentul de date la etichetă +# /D +# d , ! /buf + d Afișează segmentul de date la etichetă +# R,CTRL LR Actualizează ferestrele qq Terminați trasarea, reveniți la shell Comanda g vă permite să săriți la o anumită linie dintr-un fișier sursă Această comandă vine în trei versiuni Dacă este precedat de un număr de linie, trasorul continuă până când ajunge la acea linie Dacă există un steag /T (cu sau fără +# caractere în adresă), numărul de linie pe care trebuie să se oprească trasorul este calculat pe baza etichetei comenzii m Dacă nu există elemente suplimentare înaintea comenzii g, trasorul continuă să execute comenzi până când ajunge din nou la linia cu numărul curent Există două variante ale comenzii /labei: pentru etichetele de comandă și etichetele de date În primul caz, rândul din fereastra de jos este completat sau înlocuit cu setul de date începând cu eticheta dată În al doilea caz, comanda /labei: este echivalentă cu comanda g Eticheta poate fi urmată de un semn plus și un număr (în Tabelul B , numerele sunt notate cu #) pentru a permite decalajul față de etichetă Comanda b poate fi folosită pentru a seta un punct de întrerupere Comanda b poate fi precedată de o etichetă de comandă cu sau fără decalaj Dacă se întâlnește o linie de punct de întrerupere în timpul execuției, trasorul se oprește Pentru a relua execuția de la un punct de întrerupere, este necesară o comandă de returnare sau de rulare Dacă eticheta și numărul sunt omise, punctul de întrerupere este setat pe linia curentă Comanda specială c vă permite să eliminați punctul de întrerupere, care, ca și comanda b, poate fi precedat de etichete și numere Există, de asemenea, o comandă de rulare r, pe care trasorul o execută până la un punct de întrerupere, un apel la o comandă de terminare sau la sfârșitul comenzilor În plus, urmăritorul ține evidența nivelului subrutinei la care rulează programul Acest nivel este listat în secțiunea procesor; poate fi determinată și de numerele din secțiunea stivă Există trei comenzi bazate pe nivelurile subrutinei Comandă - face ca programul de urmărire să ruleze până când nivelul curent al subrutinelor este înlocuit cu unul inferior (mai precis, următorul în ordine descrescătoare) De fapt, această instrucțiune continuă să execute instrucțiuni de procesor până la finalizarea subrutinei curente Funcția opusă este îndeplinită de instrucțiunea +, care face ca programul de urmărire să ruleze până când trece la un nivel superior (următorul în ordine descrescătoare) de subrutine Comanda = continuă trasarea la un nivel similar cu cel curent și poate fi folosită pentru a executa subrutine în cadrul comenzii CALL Când utilizați comanda = detaliat se va reduce subrutina nu este indicată în fereastra de urmărire Există o comandă similară, n, care continuă execuția până la următoarea linie a programului Este util în special atunci când este apelat ca o comandă LOOP; execuția se oprește la sfârșitul buclei Acțiuni pregătitoare Această secțiune listează pașii de care trebuie să vă pregătiți pentru a utiliza instrumentele de mai sus În primul rând, trebuie să alegeți software-ul pentru o anumită platformă Am compilat versiuni pentru Solaris, UNIX, Linux și Windows Toate aceste versiuni sunt disponibile pe CD-ul însoțitor și online la www prenhall com/tanenbaum Accesați site-ul, apoi secțiunea Companion Web Site aferentă acestei cărți și, în final, selectați linkul dorit din meniul din stânga Despachetați fișierul zip selectat în folderul de asamblare Acest folder și subfolderele sale conțin tot materialul necesar Pe CD, folderele principale sunt Bigendnx, LtlendNx și MSWindos Fiecare dintre ele are un subfolder de asamblare, în care, din nou, puteți găsi tot ce aveți nevoie Cele trei foldere menționate sunt pentru sistemele Little Endian UNIX (adică stațiile de lucru Sun), pentru sistemele Little Endian UNIX (sisteme de operare Linux instalate pe PC) și sistemele Windows După despachetare sau copiere, următoarele subfoldere ar trebui să apară în folderul de asamblare: READ ME, bin, as src, trce src, exemple și exercițiu Fișierele sursă precompilate sunt în folderul bin, iar binarele corespunzătoare se află în folderul exemple Pentru a obține informații de bază despre cum funcționează sistemul, accesați folderul exemple și introduceți comanda t HlloWrld Această comandă este prezentată în primul exemplu din secțiunea Exemple Codul sursă pentru asamblator se află în folderul as src Fișierele sursă sunt scrise în C și pot fi recompilate cu următoarea comandă Pentru platformele compatibile cu POSIX, un utilitar Makefile este furnizat în folderul sursă pentru a efectua recompilarea Pentru Windows, există un fișier batch make bat Este posibil să fie nevoie fie să mutați executabilele în folderul programului după compilare, fie să modificați variabila PATH pentru a face ca asamblatorul as și programul de urmărire t să fie vizibile din folderele sursă Dacă acest lucru nu se face, atunci în loc de comanda t , va trebui să introduceți calea completă către fișier Pe sistemele Windows și XP, driverul terminalului ansi sys trebuie instalat; Pentru a face acest lucru, adăugați următoarea linie în fișierul de configurare config nt: device=%systemRoot%\System \ansi sys Acest fișier se află pe următoarea cale: + în Windows - \winnt\system \config nt; + în Windows XP - \windows\system \config nt UNIX și Linux folosesc de obicei driverul standard Exemple În secțiunile Procesor , Memorie și Adresare și Set de instrucțiuni , ne-am uitat la procesorul , memoria și instrucțiunile acestuia Apoi, în secțiunea „Asamblator”, am analizat limbajul principal de asamblare pentru acest manual - as Secțiunea Tracer a fost dedicată studiului trasorului În cele din urmă, în secțiunea „Pași pregătitori”, au fost date instrucțiuni pentru configurarea casetei de instrumente Teoretic, toate aceste informații sunt destul de suficiente pentru scrierea și depanarea programelor în limbaj de asamblare folosind aceste instrumente În același timp, ni se pare că va fi interesant pentru cititor să se familiarizeze cu exemple detaliate de programe în limbaj de asamblare și modalități de a le depana folosind un trasor Astfel de exemple sunt prezentate în această secțiune Toate programele pe care le vom acoperi aici pot fi găsite în folderul de exemple al setului de instrumente Auto-asamblarea și urmărirea fiecărui exemplu sunt binevenite cu căldură Salut Lume Să începem cu programul exemplu HlIoWrld s Listarea B arată codul sursă al programului, iar în fig B arată conținutul ferestrei de urmărire În Lista , un caracter de comentariu (!) separă comenzile de numerele de rând Primele trei linii conțin definiții constante care leagă aliasurile celor două apeluri de sistem și fișierul de ieșire la reprezentările lor interne respective EXIT = I CS: DS=SS = ES: MOV CX,de-hw I SCRIE= ! AH: AL: c AX: PUSH CX I STDOUT = I BH: BL: BX: PUSH HW I SECT TEXT ! CH: CL: c CX: PUSH STDOUT I start: I DH: DL: DX: PUSH WRITE I MOV CX de-hw ! SP: fd SF ODSZC => SYS I PUSH CX! BP: CC -> P - - => ADD SP, I PUSH hw! SI: IP c:PC SUB CX,AX I PUSH STDOUT I D : start + c PUSH CX I PUSH WRITE E SYS! I ADAUGĂ SP, ! SUB CX AX ! hw PUSH CX! ■ > Bună ziua WorldXn PUSH EXIT ! hw + = : ( c c f î > f Hello World SYS! SECT DATE ! hw:! optsprezece ASCII „Bună WordXn* ! de: BYTE ! douăzeci A Orez LA Conținutul ferestrei de urmărire când este executat programul din lista B Lista B Codul de asamblare al programului HlIoWrld s EXI T = ! unu SCRIE= ! STDOUT= ! SECT TEXT ! continuarea iP FW i irilijomyo d i programare în limbaj de asamblare Lista B (continuare) începe: eu MOV CXjde-hw I PUSH CX! PUSH hw! opt PUSH STDOUT ! nouă PUSH SCRIE! SYS! unsprezece ADAUGĂ SP, ! SUB CX,AX ! PUSH CX! paisprezece împingeți ieșirea I SYS SECT DATE ! hw: ASCII „Bună lume\n” ! nouăsprezece de: BYTE ! douăzeci Pseudo-comanda SECT de pe linia indică faptul că următoarele linii fac parte dintr-o secțiune de text, cu alte cuvinte, sunt instrucțiuni ale procesorului De asemenea, tot ceea ce urmează linia este considerat date Linia inițializează un șir de date format din octeți, inclusiv un spațiu și un caracter newline (\n) la sfârșit Rândurile , și conțin etichete, notate cu două puncte (:) Ele reprezintă valori numerice, asemănătoare constantelor În acest caz, asamblatorul trebuie să determine aceste valori numerice Deoarece eticheta de început se află la începutul secțiunii de text, se presupune că valoarea corespunzătoare este , dar valorile din etichetele ulterioare ale secțiunii de text (nu sunt afișate în acest exemplu) sunt determinate de numărul de octeți de cod precedați Acum luați în considerare linia Se termină cu diferența dintre cele două etichete - o constantă numerică Astfel, linia poate fi echivalată cu următoarea expresie: MOV SHD Singura diferență dintre ele este că într-un caz lungimea șirului este determinată de asamblator, iar în celălalt de programator Valoarea specificată aici exprimă cantitatea de spațiu din secțiunea de date rezervată pentru a găzdui linia situată pe linia Comanda mov de pe linia este comanda pentru a copia de -hw în registrul CX Conținutul liniilor - demonstrează mecanismul de generare a apelurilor de sistem în setul de instrumente utilizat De fapt, aceste linii reprezintă un apel de funcție tradus în limbaj de asamblare din limbajul C: write(l, hw, ); Aici, primul parametru este un descriptor de fișier la ieșirea standard ( ), al doilea este adresa liniei de afișat (hw), iar al treilea este lungimea liniei ( ) În liniile - , acești parametri sunt împinși pe stivă în ordine inversă, ceea ce corespunde secvenței de apel acceptate în C și utilizate de acest program de urmărire Linia împinge numărul de apel de sistem pentru funcția write( ) în stivă, iar linia execută apelul în sine Această ordine corespunde în cea mai mare parte mecanismului de execuție a unui program în limbaj de asamblare în clone UNIX (sau Linux), dar când rulează într-un sistem de operare diferit, Pe un sistem dat, acesta trebuie ajustat pe baza unor pași specifici în executarea apelurilor de sistem Cu toate acestea, chiar și atunci când rulează pe Windows, asamblatorul as și trasorul t implementează reguli de apelare UNIX Apelul de sistem pe linia AND este responsabil pentru ieșirea datelor Codul de pe linia curăță stiva, resetând indicatorul stivei la valoarea pe care o avea înainte ca patru cuvinte de octeți să fie plasate pe stivă Dacă apelul de scriere reușește, numărul de octeți scriși este returnat în registrul AX Pe linia* , rezultatul apelului de sistem după linia AND este scăzut din lungimea inițială a șirului stocat în CX; aceasta verifică succesul apelului, adică scrierea efectivă a tuturor octeților Astfel, codul de ieșire trebuie să fie egal cu zero dacă apelul are succes și, în consecință, nu este egal cu zero în caz contrar Liniile și pregătesc apelul de sistem de ieșire, care se execută pe linia ; pentru a face acest lucru, codurile de ieșire și funcțiile legate de apelul EXIT sunt introduse în stivă Rețineți că în comenzile mos și sub, primul argument indică destinația, iar al doilea argument indică sursă Aceasta este particularitatea asamblatorului nostru; la alți asamblatori, ordinea poate fi diferită Alegerea de către dezvoltatori a uneia sau alteia opțiuni, în general, este arbitrară Acum să încercăm să asamblam și să rulăm programul HlloWrld s Comenzile prezentate sunt potrivite atât pentru UNIX, cât și pentru Windows Pentru Linux, Solaris, MacOS X și alte clone UNIX, procedura este aceeași ca și pentru UNIX de bază Mai întâi, deschideți o fereastră de prompt de comandă (shell shell) Pe Windows, în majoritatea cazurilor, acest lucru se face selectând Start Programs ► Accessories ► Command Prompt Apoi, navigați la directorul de exemple cu comanda cd Argumentul acestei comenzi este ales în funcție de locația casetei de instrumente în sistemul de fișiere Verificați dacă există binare de asamblare și urmărire în acest director Pentru a face acest lucru, utilizați comanda Îs (UNIX) sau dir (Windows) Aceste fișiere sunt denumite ca și, respectiv, t Într-un mediu Windows, au extensia exe, dar nu trebuie să o specificați în comenzi Dacă asamblatorul fișiere și trasor; lipsesc în directorul numit, găsiți-le și copiați-le în el După aceea, asamblați programul de testare folosind comanda as HlloWrld s Dacă binarul asamblatorului este într-adevăr în directorul examplot dar după rularea acestei comenzi, este afișat un mesaj de eroare, în UNIX, încercați linia: ,/as HlloWrld s Pe Windows, în același scop, utilizați linia: \as HlloWrld s În cazul finalizării cu succes a ansamblării, trebuie să fie afișate următoarele mesaje: Project HlloWrld listfile HlloWrld $ Project HlloWrld num file HlloWrld # Project HlloWrld loadfile HlloWrld i irilizhvniv despre și programare în limbaj de asamblare Desigur, trebuie create și fișierele corespunzătoare Dacă nu au existat mesaje de eroare, introduceți comanda t HlloWrld Ca rezultat, o săgeată va apărea în secțiunea din dreapta sus a ferestrei de urmărire, indicând comanda MOV CX, de-hw Aceasta este comanda de la linia din listarea B Apoi apăsați tasta de întoarcere la cărucior (numită Enter pe tastaturile PC) După cum puteți vedea, săgeata indică acum comanda push cx În registrul CX, conform conținutului secțiunii din stânga a ferestrei, valoarea este acum Apăsați din nou tasta de întoarcere a căruciorului și rețineți că valoarea s a apărut în secțiunea din mijloc sus - echivalentul hexazecimal al zecimalului Această secțiune arată conținutul stivei, unde în acest moment există un cuvânt - Apăsați tasta de întoarcere a carului de încă trei ori și familiarizați-vă cu modul în care vor fi procesate comenzile de la rândurile - După aceea, ar trebui să existe patru elemente pe stivă, iar în secțiunea din stânga, valoarea contorului programului este hexazecimal b Data viitoare când apăsați tasta de întoarcere cărucior, va fi executat un apel de sistem și următoarea linie va apărea în secțiunea din dreapta jos a ferestrei: „Bună lume\n” După cum puteți vedea, acum valoarea registrului SP este x ff O altă apăsare a tastei va crește SP cu - până la x ff După patru apăsări ale tastei de întoarcere a căruciorului, apelul de sistem de ieșire se va finaliza, la fel ca și traseul în sine Pentru a înțelege cum funcționează totul, este util să deschideți fișierul hlIoWrld s în orice editor de text (este mai bine să refuzați utilizarea procesoarelor de text în acest caz) Pe UNIX, acest lucru se poate face în ex, vi sau emacs; pe Windows, alegerea cade în mod firesc pe Notepad (Notepad), pentru a deschide, pe care de obicei selectați comanda Start Programs ► Accessories ► Notepad (Start ► Programs ^ Accessories ^ Notepad) Procesorul de text Word nu este potrivit, deoarece formatarea poate distorsiona textul programului Schimbați mesajul de pe linia , salvați fișierul, asamblați-l și rulați-l în tracer Așa că vei face primul pas în domeniul programării în limbaj de asamblare Registre de uz general Următorul exemplu arată în detaliu mecanismul de mapare a registrului, precum și unul dintre „capcanele” operației de multiplicare B b arată secțiunea de registru a ferestrei trasoare după executarea liniei CS:OO DS-SS-ES AN: AI : AX: HT: BI : TH: CH: CL: a CX: DHrOO DLrOO DX: SP: fe SF ODS zc BP: CC -> P aa S : IP : : PC D : start + A CS: DS= AH: AL: BH: BL: CH: CL: DH: DL: SP: fe SF BP: CC SI : IP Dl: st S-ES AX: TX: CX: DX: ODSZC v > p - c :PC irt + Orez LA Secțiunea registru fereastră trasoare: după executarea liniei (a); după șapte treceri ale buclei de multiplicare (b) Lista B O parte a programului genReg s start: MOV AX, ! ADDB AH,AL ! cinci MOV CX,(ori) ! MOV BX,muldat ! MOV AX,(BX) ! opt buză: MUL (BX) ! nouă LOOP buza SECT DATE ! unsprezece ori: CUVANT ' muldat: CUVANT , ! Următoarea instrucțiune de pe linia încarcă valoarea în registrul AX: MOV AX, Ca rezultat, registrul AH este setat la , iar registrul AL este setat la Apoi, pe linia , se adaugă valorile AL și AH, iar valoarea lui AH este trei Linia copiază conținutul variabilei timpi ( ) în CX Linia încarcă registrul BX cu adresa variabilei muldat egală cu , deoarece se află în al doilea octet al secțiunii de date În acest moment, captura de ecran prezentată în Fig B , a Rețineți că AH este , AL este și AX este ; acest lucru nu este surprinzător, deoarece x + = Următoarea comandă (pe linia ) copiază conținutul variabilei muldat în registrul AX Astfel, după apăsarea tastei de întoarcere a căruciorului, valoarea lui AX se va schimba la Acum suntem gata să rulăm o buclă care înmulțește conținutul registrului AX cu cuvântul BX (adică muldat + ), care conține valoarea Adresa țintă implicită pentru instrucțiunea mul este combinația de registru DX : AX La prima iterație a buclei, rezultatul ( ) se potrivește într-un cuvânt, deci este stocat în AX și DX rămâne zero Conținutul tuturor registrelor după treceri ale ciclului de înmulțire este prezentat în fig V , Întrucât valoarea inițială a lui AX era , după șapte înmulțiri cu două, rezultatul devine Deoarece nu se încadrează în registrul AX, produsul este stocat în registrul de de biți format prin concatenarea registrelor DX : AX ; deci DX conține valoarea * , iar AX este Când este calculat, de fapt se dovedește că x + - = Rețineți că valoarea CX în această etapă este , deoarece instrucțiunea LOOP o scade cu una în timpul fiecărei treceri Deoarece valoarea inițială a acestui registru era , după șapte invocări ale instrucțiunii MUL (și șase treceri ale instrucțiunii buclei), valoarea CX a scăzut la Dificultăți apar în timpul următoarei operațiuni de înmulțire La înmulțire, este implicată doar valoarea AX, în timp ce valoarea DX este ignorată; astfel, instrucțiunea mul înmulțește AX ( ) cu și obține Adică, noua valoare a lui AX devine , iar registrul DX este setat la zero, ceea ce este incorect numeric Apelarea instrucțiunilor și a registrelor pointerului Următorul nostru exemplu, vecprod s, este un program mic care calculează produsul interior a doi vectori, veci și vec Codul său este prezentat în Lista B Listarea V Z Programul vecprod s -EXIT = ! EXIT definiția valorii PRINTF= ! Definiția valorii PRINTF SECT TEXT ! începutul secțiunii de text inpstart: ! definiție de etichetă inpstart MOV BP,SP ! Salvați SP în VR împinge vec ! introducere la adresa stivei ѵec PUSH veci! împingând adresa veci pe stivă MOV CX,vec -vecl ! CX = numărul de octeți din vector SHR CX, ! CX = numărul de cuvinte din vector PUSH CX! introducere stiva de cuvinte Apelați vecmul ! vecmul apel MOV (inprod)jAX ! mutare AX IMPINGE SEORUL! introducere în stiva ! rezultatul ieșirii PUSH pfmt! introducere în stiva ! formatează adresele șirurilor PUSH PRINTF ! introducere în stiva ! codul funcției PRINTF SYS! Apel PRINTF ADAUGĂ SP, ! curățare stive PUSH împingând stiva de coduri de stare PUSH EXIT ! introducere în stiva de coduri a funcției EXIT SYS! Apelul funcției EXIT vecmul: ! start vecmul(count, veci, vec ) PUSH BP! împingând valoarea BP pe stivă MOV BP,SP ! copiați SP în BP pentru a accesa argumente MOV CX, (BP) ! de plasare contor în SH ! pentru controlul ciclului MOV SI, (BP) ! SI = veci MOV DI, (BP) ! DI = vec împinge ! împingând valoarea pe stivă : LODS! deplasare (SI) în AX MUL (DI) ! înmulțiți AX cu (DI) ADĂUGAȚI - (BP),AX ! AH adaos ADD DI, I LOOP lb I POP AX I POP BP I RET! SECT DATE ! pfmt: ASCIZ „Produsul interior este: %d\n” ! ALIGN ! vezi: CUVANT , , , , ! vec : CUVANT , , , , ! SECT BSS inprod: SPACE • la valoarea stocată DI cresc pentru a indica următorul element dacă CX > , reveniți la eticheta b apare partea de sus a stivei în AX Recuperare VR întoarcere din subrutină începutul secțiunii de date de linii adresa de paritate forțată vectorul vectorul începutul secțiunii BSS alocarea spațiului pentru inprod Prima parte a acestui program este de a pregăti un apel către funcția vecmul; pentru a face acest lucru, SP este stocat în BP, iar apoi adresele vec și veci sunt împinse pe stivă, ceea ce face posibil ca funcția vecmul să le acceseze Apoi, în linia , lungimea vectorului în octeți este încărcată în CX După mutarea acestui rezultat cu bit la dreapta (pe linia ), valoarea CX exprimă numărul de cuvinte din vector care este împins pe stiva de pe linia Apelul către vecmul se face pe linia Merită remarcat, din nou, că argumentele subrutinei sunt împinse în stivă în ordine inversă, iar acest lucru se face pentru a se conforma ordinii de apelare C Deci, folosind C, funcția vecmul poate fi numită după cum urmează: vecmul(count, veci, vec ) În timpul execuției instrucțiunii de apel, adresa de retur este împinsă în stivă Puteți determina din urmă că această adresă este x Prima comandă din subrutină este PUSH Se execută pentru indicatorul de bază (BP) de pe linia Valoarea BP este reținută deoarece acest registru va fi necesar pentru a aborda argumentele și variabilele locale ale acestei subrutine Mai mult, în linia , indicatorul de stivă este copiat în registrul BP; astfel, noua valoare a indicatorului de bază specifică valoarea veche a indicatorului de stivă După aceea, totul este gata pentru a încărca argumentele în registre și pentru a rezerva spațiu pentru o variabilă locală Următoarele trei linii scot argumentele pe rând din stivă și le plasează într-un registru După cum vă amintiți*, stiva este optimizată pentru stocarea cuvintelor, ceea ce înseamnă că adresele trebuie să fie egale Adresa de retur urmează imediat după vechiul indicator de bază și, prin urmare, este accesată* ca (BP) Următorul argument este count - (VR) Este încărcat în registrul CX de pe linia Pe liniile și , vectorii veci și vec sunt încărcați în registrele SI și, respectiv, DI Pentru a stoca rezultatul intermediar, această rutină are nevoie de o variabilă locală cu o valoare inițială de În acest sens, în linia , valoarea este împinsă în stivă Starea procesorului chiar înainte de prima trecere a buclei, care apare pe linia , este prezentată în Figura LA Fereastra îngustă din mijlocul părții superioare (în dreapta registrelor) arată zona stivei În partea de jos este adresa ѵес ( x ); apoi, în ordine crescătoare, urmează adresa veci ( x ) și un al treilea argument care exprimă numărul de elemente din fiecare vector ( x ) Apoi este specificată adresa de retur ( x ) Numărul din stânga acestei adrese indică faptul că este o adresă de retur la un nivel oi distanță i iri/іizhvpio o і ірі rammirimmi in mi MjbiRtJ ttuuoMU/Jurassic programul principal În caseta de sub registre apare și numărul , dar de data aceasta reprezintă o adresă simbolică Deasupra adresei de retur de pe stivă este vechea valoare a BP ( x fc ) și zero, împinsă pe stivă pe linia Săgeata care indică această valoare reflectă poziția pointerului stivei (registrul SP) Fereastra din dreapta secțiunii stivei arată o bucată de text de program; săgeata de aici indică următoarea comandă în ordinea execuției Acum luați în considerare bucla care începe la linia Instrucțiunea LODS încarcă cuvântul de memorie din segmentul de date în AX prin registrul SI Deoarece steag-ul de direcție este setat, instrucțiunea LODS este executată în modul de auto-incrementare, ceea ce înseamnă că după finalizare, registrul SI indică următorul element al veci Pentru a vizualiza ce se întâmplă, rulați comanda tracer t veeprod Când apare fereastra de urmărire, introduceți următoarea comandă: /vecmul+ b MOV BP SP PUSHvec PUSH veci MOV CX,vec -vec SHR CX, PUSH CX CALL vecmul BP SP CX, (BP) SI, (BP) DI, (BP) vecmul: PUSHBP MOV MOV ' MOV MOV j APĂSĂ : LODS ! MUL (Dl) ADD- (BP),AX ! ADAUGĂ Dl, I LOOP b eu ! ! ! ! • • • • • • • CS: DS=SS=ES AH: AL: AX: HH: BL: IN: CH: CL: CX: DH: DL: DX: SP: fb SF ODSZC BP: fb CC -> pz - SI : IP: :PC Dl: vecmul+ => fc PUSHBP ! MOV BP SP ! MOV CX, (BP) • MOV SI, (BP) • MOV DI, (BP) • PUSHO l = > : LODS • MUL (Dl) ! ADD - (BP),AX ! treizeci ■ ved + o = : b vec + = : pfmt+O = : e The in prod pfm + = : a %d! cinci Orez LA Conținutul ferestrei de urmărire pentru programul veeprod s când este atinsă linia , dar înainte de începerea buclei Apoi apăsați tasta de retur caruș, setând astfel un punct de întrerupere pe linia care conține comanda LODS (Nu vă vom reamintim mai târziu că trebuie să apăsați tasta de întoarcere la cărucior după toate comenzile ) Introduceți comanda g Ca rezultat al executării acestei comenzi, urmăritorul va executa comenzi până la punctul de control În acest caz, se va opri la linia care conține comanda LODS Pe linia , valoarea lui AX este înmulțită cu operandul original Cuvântul de memorie asociat cu instrucțiunea MUL este selectat din segmentul de date utilizând registrul DI folosind adresarea indirectă a registrului Adresa țintă implicită (nespecificată în instrucțiune) a instrucțiunii MUL este combinația de registre DX : AX Linia adaugă rezultatul la variabila locală situată pe stiva la adresa - (VR) Deoarece instrucțiunea MUL nu se efectuează automat incrementați operandul său, această acțiune este efectuată în mod explicit pe linia După aceasta, registrul DI indică următorul element wec Etapa curentă a programului se încheie cu comanda LOOP Valoarea registrului CX este incrementată negativ, iar dacă după aceea rămâne pozitivă, programul sare la eticheta locală pe linia Eticheta locală b înseamnă căutarea celei mai apropiate etichete în direcția opusă poziției curente Când bucla se termină, subrutina introduce valoarea returnată din stivă în registrul AX (linia ), restabilește valoarea BP (linia ) și revine la programul de apelare (linia ) După apel, execuția programului principal este reluată cu comanda moѵ (săriți la linia ) Această comandă deschide o secvență de cinci comenzi menite să afișeze rezultatul Apelul de sistem printf este modelat după funcția printf a bibliotecii de programare standard C Liniile - împing argumente în stivă: valoarea întregului* care trebuie tipărită, adresa șirului de format (pfmt) și funcția printf cod ( ) Șirul de format pfmt conține caracterul %d pentru a indica faptul că variabila întreagă necesară pentru formatare este argumentul apelului printf Pe linia , stiva este curățată Deoarece începutul programului este pe linia* , unde pointerul stivei a fost stocat în registrul indicatorului de bază, puteți rula la fel de bine comanda pentru a șterge stiva meu SP,BP Avantajul acestei soluții este că programatorul nu trebuie să țină evidența stivei În cazul programului principal, acest lucru nu este foarte important, dar atunci când lucrați cu subrutine, această abordare vă permite să scăpați de datele inutile, cum ar fi variabilele locale învechite Subrutina vecmul poate fi inclusă în alte programe Dacă numele fișierului sursă vecprod s este plasat pe linia de comandă înaintea numelui altui fișier sursă în limbaj de asamblare, acesta din urmă poate apela rutina pentru înmulțirea a doi vectori cu lungime fixă Pentru a evita duplicarea, se recomandă mai întâi să excludeți definițiile constantelor EXIT și -PRINTF Dacă fișierul antet syscalnr h este inclus, nu este nevoie să scrieți definiții constante de apel de sistem în altă parte Depanarea unui program de ieșire Array Programele revizuite au fost simple, dar lipsite de erori În exemplul următor, vom arăta cum ajută trasorul la depanarea programelor cu erori Următorul nostru program este să scoatem un tablou întreg definit după eticheta veci Există erori în versiunea ei originală Pentru a le identifica, vom folosi un asamblator și un trasor, dar mai întâi vom discuta despre cod Deoarece apelurile de sistem și, prin urmare, constantele prin care aceste apeluri pot fi distinse prin numere, sunt necesare oricărui program, am separat definițiile constantelor cu aceste numere într-un fișier antet separat, care este inclus în codul din prima linie : #include „ /syscalnr h” Printre altele, acest fișier definește constante pentru următorii descriptori de fișiere: STDIN* STDOUT* STDERR- Acestea se deschid la începutul procesului, iar antetul conține etichete care indică secțiuni de text și date Este logic să includeți acest fișier în antetul tuturor fișierelor de asamblare sursă, deoarece definițiile din el sunt foarte solicitate Dacă codul sursă este răspândit pe mai multe fișiere, asamblatorul include o singură versiune a fișierului antet, evitând astfel situația definițiilor multiple ale constantelor Programul arrayprt este prezentat în Lista B Codul nu este comentat, deci întrucât presupunem că până acum cititorul este deja destul de familiarizat cu setul de instrucțiuni În linia , adresa stivei goale este plasată în registrul indicatorului de bază - aceasta oferă posibilitatea de a șterge stiva prin copierea pointerului de bază la pointerul stivei, ceea ce se face în linia În exemplul anterior (linii - ), am luat în considerare deja situația calculării și introducerii în teanc de argumente înainte de apel Liniile - încarcă registrele în subrutină Listarea B programul arrayprt înainte de depanare tfinclude " ,/syscalnr h" ! unu SECT TEXT ! vecpstrt: ! MOV BP,SP ! PUSH veci! cinci MOV CX,frmatstr-vecl ! SHR CX! PUSH CX! opt CALLvecprint ! nouă MOVSP,BP! PUSH ! unsprezece PUSH EXIT ! SYS! SECT DATE ! paisprezece vezi: CUVANT , , , , ! cincisprezece frmatstr: ASCIZ '^s" ! frmatkop: ! ASCIZ „Matricea conține ” ! frmatint: ASCIZ " %d" ! nouăsprezece SECT TEXT > vecprint: ! IMPINGAȚI BP! MOV BP,SP ! MOV CX, (BP) ! MOV BX, (BP) ! MOV SI, ! PUSH frmatkop exemple PUSH frmatstr I PUSH PRINTF SYS MOV- (BP),frmatint I MOV DI,(BX)(SI) ! MOV- (BP),DI SYS! I N C S I BUCLA b! împingeți „\n” ! PUSH PUTCHAR ! SYS! MOV SP,BP RET Liniile - ale codului arată cum să tipăriți un șir de caractere, iar liniile - vor executa apelul de sistem printf pe o valoare întreagă Adresa unui șir de caractere este împinsă în stivă la linia , iar la linia* o valoare întreagă este împinsă în stivă În ambele cazuri, adresa șirului de format este primul argument al comenzii printf Liniile - scot un singur caracter folosind apelul de sistem putchar Acum să încercăm să asamblam și să rulăm programul Pentru a face acest lucru, introduceți comanda as arrayprt s Acest lucru are ca rezultat un mesaj de eroare de operand pe linia din arrayprt S Acest fișier este generat de asamblator prin concatenarea fișierelor include cu fișierul sursă; este fișierul rezultat care este procesat de asamblator Mesajul de eroare se referă la linia a acestui fișier îmbinat Examinarea liniei a fișierului arrayprt s nu va da nimic - numerotarea liniei din cele două fișiere nu se potrivește din cauza includerii liniilor de fișier antet în fișierul arrayprt s Linia din arrayprt s corespunde liniei din arrayprt s deoarece fișierul antet inclus syscalnr h conține de linii Pe UNIX, puteți căuta linia în arrayprt s tastând head - arrayprt $ Această comandă tipărește primele de linii ale fișierului combinat În consecință, eroarea trebuie căutată în linia de jos a listării Un efect similar poate fi obținut prin vizualizarea fișierului îmbinat într-un editor de text Astfel, localizam eroarea pe linia a programului original, care contine instructiunea SHR Studiind tabelul B problema este ușor de detectat: am uitat să specificăm valoarea offset-ului Linia după corecție ar trebui să arate astfel: SHR cx,i Este important de reținut că eroarea trebuie corectată în fișierul arrayprt s, și nu în fișierul combinat arrayprt s, deoarece acesta din urmă este actualizat automat de fiecare dată când asamblatorul este rulat Următoarea încercare de a asambla codul sursă, în teorie, ar trebui să reușească Apoi pornim trasorul cu comanda t arrayprt Anexa B Programare în limbaj de asamblare În timpul urmăririi, observăm că rezultatul nu se potrivește cu vectorul din segmentul de date Vectorul conține valorile , , , și , în timp ce secvența de ieșire începe la , , În mod clar, ceva nu este în regulă Pentru a găsi eroarea, trasorul poate fi repornit și poate urmări starea mașinii pas cu pas până când apare o valoare incorectă Valoarea de ieșit este stocată în memorie pe liniile și Linia de ieșire a valorii nevalide este un loc bun pentru a începe să căutați La a doua trecere a buclei, devine observabil că valoarea numerică a SI este impară, ceea ce nu ar trebui să fie prin definiție, deoarece indexarea se face prin cuvinte, nu pe octeți Astfel, problema se află pe linia Valoarea SI din aceasta este incrementată cu unu, în timp ce incrementul corect este Pentru a corecta eroarea, linia trebuie schimbată după cum urmează: ADAUGĂ SIj După corectare, lista de numere afișată nu ridică nicio reclamație Cu toate acestea, ne confruntăm cu o altă eroare După ce apelul la vecprint se termină și returnează o valoare, urmăritorul marchează o eroare în pointerul stivei Soluția evidentă este să verificați dacă valoarea introdusă în stivă atunci când este apelată vecprint se potrivește cu valoarea de deasupra stivei atunci când este executată comanda ret de pe linia După cum se dovedește, acestea nu se potrivesc Deci linia ar trebui înlocuită cu două linii noi: ADAUGĂ SPjlO POP VR Prima comandă elimină cuvinte împinse pe stivă în timpul apelului la vecprint; aceasta accesează valoarea BP stocată pe linia Prin scoaterea acestei valori din stivă, restabilim valoarea registrului BP înainte de apel și obținem adresa corectă de retur Acum programul se iese corect Nu este un secret că depanarea codului de limbaj de asamblare este mai mult o artă decât o știință, dar nu neglijați ajutorul unui trasor, care simplifică foarte mult procesul Procesarea șirurilor de caractere și comenzile șirurilor Scopul principal al acestei subsecțiuni este de a arăta mecanismul de gestionare a comenzilor șir repetate Listările C și C b prezintă programe simple de procesare a șirurilor de caractere, strngcpy s și reverspr s, aflate în folderul de exemple Listarea B Copierea unui șir (strngcpy s) SECT TEXT stcstart: ! unu PUSH mesaje! PUSH meg ! Apelați strngcpy! ADAUGĂ SPj I IMPINGAȚI ! IMPINGAȚI ! SYS! opt Exemple c strngcpy: PUSH CX PUSH SI I PUSH DI! PUSH BP! MOV BP,SP ! paisprezece MOV AX, ! cincisprezece MOV DI, (BP) ! MOV CX,- ! REPNZ SCASB! optsprezece NEGCX > DECCX ! douăzeci MOV SI, (BP) ! MOV DI, (BP) ! PUSH DI! REP MOVSB ! CALL stringpr MOV SP,BP POP BP POP DI! POP S! POP CX! treizeci RET! SECT DATE ! mesgl: ASCIZ „Aruncă o privire\n” ! mesg : ASCIZ "qrst\n" SECT BSS ! Listarea B Ieșire șiruri de caractere înapoi (reverspr s) #include "" /syscalnr h" ! începe: MOV DIjStr ! IMPINGE SEORUL! MOV BP,SP ! PUSH PUTCHAR I MOVB AL,'\n' ! MOV CX,- ! REPNZ SCASB! opt NEG CX STD! DECCX ! unsprezece SUB DI, ! MOV SI,DI ! : LODSB! paisprezece MOV (BP),AX I SYS! BUCLA b! MOVB (BP),'\n' ! optsprezece SYS! nouăsprezece împinge ! douăzeci PUSH EXIT ! SYS! SECT DATE ! str: ASCIZ "invers\n" ! Anexa B Programare în limbaj de asamblare Lista B arată programul de copiere a șirurilor Apelează subrutina stringpr, care poate fi găsită și într-un fișier separat stringpr s (acest fișier nu este listat în aplicația noastră) Pentru a asambla un program care conține subrutine în fișiere separate, toate fișierele sursă trebuie specificate în comanda as , începând cu programul principal, care determină numele fișierelor executabile și auxiliare De exemplu, pentru a asambla programul prezentat în listarea B , introduceți comanda as strngcpy s stringpr s Programul din Lista B scoate șiruri de caractere în ordine inversă Ne vom uita pe rând la ambele programe În Lista B , liniile de cod sunt numerotate, începând cu prima etichetă Programul principal (liniile - ) începe prin apelarea subrutinei strngcpy cu două argumente: șirul sursă mesg și șirul țintă mesgl; subprogramul copiază conținutul primului în al doilea Acum să aruncăm o privire mai atentă la subrutina strngcpy care începe pe linia a codului Se așteaptă ca adresele bufferului țintă și ale șirului sursă să fie împinse în stivă chiar înainte de a fi apelată În rândurile - , registrele implicate sunt salvate prin împingerea valorilor lor pe stivă; mai târziu, în liniile - , se presupune că vor fi restaurate În linia , valorile SP și BP sunt copiate prin metoda standard După aceea, argumentele pot fi încărcate în VR În linia , stiva este șters în modul cu care suntem deja familiarizați - valoarea BP este copiată în SP Locația centrală a subrutinei este instrucțiunea REP MOVSB, situată pe linia a codului Instrucțiunea MOVSB mută octetul indicat de registrul SI la adresa de memorie specificată de registrul DI După aceea, conținutul ambelor registre este mărit cu unul Instrucțiunea REP formează un ciclu în care este executată instrucțiunea MOVSB; după mutarea fiecărui octet, scade valoarea lui CX cu Bucla se termină când CX ajunge la zero Înainte de executarea REP MOVSB trebuie pregătite registrele, ceea ce se face în rândurile - Indicele sursă, SI, este copiat din argument pe stiva de pe linia ; indicele de destinație, DI, este definit pe linia Obținerea valorii CX este ceva mai dificilă Rețineți că sfârșitul unui șir de caractere este indicat de un octet nul Instrucțiunea MOVSB nu afectează starea steagului zero, spre deosebire de instrucțiunea SCASB (byte string scan) Acesta din urmă compară valoarea indicată de DI cu valoarea lui AL și crește DI din mers La fel ca MOVSB, este una dintre comenzile repetitive Linia șterge registrele AX și AL, linia scoate un indicator către DI din stivă, iar linia inițializează registrul CX la - Linia conține instrucțiunea REPNZ SCASB, care efectuează o operație de comparare în contextul unei bucle și, dacă este egală, setează steag-ul zero Cu fiecare trecere a buclei, CX este decrementat, iar când steag-ul zero este setat, bucla se oprește - instrucțiunea REPNZ verifică atât steag-ul zero, cât și CX Numărul de treceri de buclă cu instrucțiunea MOVSB este astfel definit ca diferența dintre valoarea curentă CX și valoarea anterioară - (liniile - ) Folosirea a două comenzi repetate nu pare foarte elegantă, dar acesta este lanțul soluției bazat pe principiul independenței codurilor de condiție față de comenzile de mutare Atunci când sunt executate bucle, registrele de index sunt incrementate, iar în acest scop indicatorul de direcție trebuie șters Pe liniile și ale codului, șirul de caractere copiat este scos folosind subrutina stringpr găsită în folderul exemple Este destul de simplu, așa că nu vom discuta aici În programul de ordine inversă prezentat în Lista C b, rândul al codului conține toate numerele standard de apel de sistem Pe linia , o valoare inactivă este împinsă pe stivă, iar pe linia , indicatorul de bază (BP) începe să indice vârful curent al stivei Acest program scoate caracterele ASCII pe rând, astfel încât valoarea numerică PUTCHAR este împinsă în stivă Rețineți că BP indică simbolul care ar trebui să fie afișat în timpul apelului SYS , Rândurile , și pregătesc registrele Dl, AL și CX pentru execuția instrucțiunii SCASB repetate Registrul de contor și indexul țintă sunt încărcate în același mod ca în programul de copiere a liniilor, cu excepția faptului că un caracter newline este plasat în registrul AL în loc de zero Astfel, instrucțiunea SCASB compară valorile caracterelor șirului str cu \n, nu zero, și setează bitul zero dacă se potrivește Instrucțiunea REP SCASB incrementează registrul DI astfel încât, după o potrivire, indexul țintă să indice caracterul zero care urmează caracterului nou linie Linia crește DI cu ; ca urmare, acest registru indică ultima literă a cuvântului Dacă șirul de caractere este scanat în ordine inversă și este afișat caracter cu caracter, atunci sarcina noastră este rezolvată; într-un astfel de caz, indicatorul de direcție de pe linia este resetat și registrele de index din instrucțiunile șirului sunt ajustate înapoi Acum comanda LODSB de pe linia* a codului copiază caracterul în AL, iar pe linia caracterul este împins pe stiva de lângă PUTCHAR, permițând comenzii SYS să-l afișeze Comenzile de pe liniile și scot o linie nouă, iar programul este în mod tradițional terminat prin apelarea EXIT Versiunea actuală a programului, totuși, conține o eroare Acesta poate fi găsit prin urmărirea pas cu pas Comanda /str plasează șirul str în câmpul de date al trasorului Deoarece valoarea numerică* a adresei de date este cunoscută, ne putem da seama cum se schimbă valorile din registrele de index în raport cu poziția șirului de caractere Eroarea, însă, este descoperită numai după apăsarea repetă a tastei de întoarcere a căruciorului Comenzile de urmărire ajută la reducerea timpului de localizare a erorilor Rulați programul de urmărire și introduceți comanda , care ne va duce la mijlocul buclei Apoi, utilizați comanda b pentru a seta un punct de întrerupere pe linia Prin crearea a două linii noi, vom vedea că ultima literă „e” este afișată în câmpul de ieșire Prin rularea comenzii r, vom face ca programul de urmărire să ruleze până la următorul punct de control sau până la încheierea procesului Astfel, rulând comanda r în secvență, puteți vedea toate literele până ajungem la soluția problemei Din această În acest moment, programul de urmărire poate fi comutat într-un mod pas cu pas și poate analiza ce se întâmplă în timpul executării celor mai importante comenzi De asemenea, putem seta un punct de întrerupere suplimentar pe o anumită linie de cod, dar acest lucru trebuie să țină cont de includerea fișierului syscalnr h, ceea ce duce la o schimbare a numerelor de linii ale codului cu Prin urmare, pentru a seta un punct de întrerupere pe, de exemplu, linia , trebuie să introducem comanda b Cu toate acestea, este mai bine să abandonați acest mod neîndemânatic în favoarea setării etichetei globale a începutului pe linia înainte de comanda situată în ea - atunci punctul de întrerupere din linia de cod dorită poate fi setat cu comanda /start+ b În plus, acest mod de a seta un punct de întrerupere vă permite să ignorați dimensiunea fișierului inclus Tabele de expediere Unele limbaje de programare au instrucțiuni select care vă permit să selectați una dintre mai multe opțiuni posibile în funcție de valoarea numerică a unei variabile Acest tip de ramificare multivariată este uneori utilă în programele în limbaj de asamblare Luați, de exemplu, un set de rutine de apeluri de sistem incluse într-un dispozitiv de captare a excepțiilor SYS Un exemplu de programare cu mai multe ramuri în limbajul de asamblare este prezentat în codul jumptbl s din Listarea B Listarea B Implementarea ramificarii multivariate folosind tabele de expediere #include „ /syscalnr h” SECT TEXT jumpstrt: ! PUSH strt! MOV BP,SP ! cinci PUSH PRINTF ! SYS! PUSH GETCHAR ! opt : SYS! nouă CMP AX, ! JL f! unsprezece CMPB AL,' ' ! JL b! CMPB AL,* * ! paisprezece IILE f! cincisprezece MOVB AL,' '+l ! : MOV BX,AX ! ȘI BX, Xf ! optsprezece SAL BX, ! nouăsprezece Apelați tbl(BX) ! douăzeci JMP b! : IMPINGAȚI ! PUSH EXIT ! SYS! ruta : MOV AX,mes ! JMP f I traseu: MOV AX, mesl I JMP f I ruta : MOV AX,mes I JMP f I ruta : MOV AX,mes I JMP f I ruta : MOV AX,mes I JMP f I ruta : MOV AX,mes I JMP f I ruta : MOV AX,mes I JMP f! ruta : MOV AX,mes I JMP f I ruta : MOV AX,mes I JMP f I erut: MOV AX,emes' I : PUSH AX I PUSH PRINTF I SYS I ADD SP, I RET I SECT DATE I tbl: WORD rout ,routl,rout ,rout ,rout ,rout , route ,rout ,rout ,rout ,erout I mes : ASCIZ „Acesta este un zero \n” I mesl: ASCIZ "Ce zici de unul \n" I mes : ASCIZ "Ai cerut un doi \n" I mes : ASCIZ "Cifra era trei \n" I mes : ASCIZ "Ai tastat un patru \n" I mes : ASCIZ "Ai preferat un cinci \n" I mes : ASCIZ „S-a întâlnit un șase \n” I mes : ASCIZ „Acesta este numărul șapte \n” I mes : ASCIZ „Această cifră nu este acceptată ca octal \n” I emes: ASCIZ "Aceasta nu este o cifră Încercați din nou \n" ! strt: ASCIZ "Tastați o cifră octală cu un return Opriți la sfârșitul fișierului \n"I Programul începe prin a scoate un șir de caractere etichetat strt, solicitând utilizatorului să introducă o cifră octală (liniile - ale codului) Un caracter este apoi citit din fișierul de intrare standard (liniile și ) Dacă *AX este mai mic de , programul interpretează acest lucru ca un marcator de sfârșit de fișier, trece la eticheta pe linia și iese cu codul de stare Dacă caracterul introdus nu este un marcator de sfârșit de fișier, caracterul introdus este examinat în registrul AL Orice caracter mai mic decat este considerat un delimitator si este ignorat la introducerea liniei de cod ; după care se extrage următorul caracter Orice caracter mai mare de este considerat nevalid Pe linia , este convertit în caracterul ASCII două puncte, care vine imediat după în secvența de caractere ASCII Astfel, pe linia , registrul AX conține o valoare între și două puncte Această valoare este copiată în registrul BX Pe linia , instrucțiunea AND maschează toți, cu excepția celor mai puțin semnificativi patru biți ai rezultatului * rămâne un număr între și (acest lucru se datorează faptului că zero corespunde codului ASCII x ) Deoarece vom indexa cuvintele din tabel, nu octeții, valoarea BX este înmulțită cu prin deplasarea la stânga în rândul Linia conține comanda de apel Adresa reală este determinată prin adăugarea valorii BX la valoarea numerică a etichetei tbl, iar conținutul acestei adrese combinate este încărcat în contorul de programe al computerului Programul selectează una dintre cele zece subrutine, în funcție de caracterul pe care îl preia din intrarea standard Fiecare dintre aceste subrutine plasează adresa unui anumit mesaj pe stivă și apoi trece la apelul comun al rutinei de sistem PRINTF pentru toți Pentru a înțelege ce se întâmplă, trebuie avut în vedere că instrucțiunile ZMP și CALL încarcă o anumită adresă a unui segment de text în registrul PC-ului Această adresă este un număr binar, iar în timpul asamblarii, toate adresele sunt înlocuite cu valorile binare corespunzătoare Valorile binare, la rândul lor, ajută la inițializarea matricei în segmentul de date, ceea ce se face pe linia Astfel, matricea începând cu eticheta tbl conține adresele de pornire ale rutinelor nouțe, routl, rout etc , doi octeți pe fiecare toata lumea Prezența adreselor de octeți explică necesitatea unei deplasări de bit făcută în linia Tabelele de acest tip sunt adesea numite tabele de expediere Mecanismul de funcționare a unor astfel de programe este demonstrat de subrutina erout (liniile - din cod) Se ocupă de numere care sunt în afara intervalului Mai întâi, linia împinge adresa mesajului (în AX) în stivă Numărul apelului de sistem printf este apoi împins în stivă Apoi, apelul de sistem este executat, stiva este șters și programul revine Celelalte zece subprograme, de la nouțe la nouțe, își încarcă adresele mesajelor în registrul AX și apoi sar la a doua linie de erupție, imprimă mesaje și termină subrutinele O modalitate de a adapta un program pentru a trimite tabele este de a-l modifica astfel încât să se formeze un mesaj semnificativ din caracterele introduse De exemplu, pentru toate caracterele, cu excepția cifrelor octale, poate fi emis un mesaj de eroare Acces la fișiere tamponat și aleatoriu Programul InFilBuf s prezentat în Lista B este un exemplu de I/O de fișier arbitrar Permite unui fișier să fie compus dintr-un număr arbitrar de șiruri de caractere, fiecare dintre ele potențial diferit ca lungime de celelalte Acest program citește mai întâi fișierul și construiește un tabel în care intrarea n reflectă poziția începutului liniei n din fișier Puteți apoi să căutați un anumit șir de caractere, să găsiți o intrare pentru acesta în tabel și să îl citiți folosind apelurile de sistem Iseek și citiți Numele fișierului de intrare standard este specificat pe prima linie de intrare Programul constă din mai multe fragmente de cod relativ independente care pot fi adaptate în alte scopuri Listarea B Un program care implementează accesul în buffer și aleatoriu la un fișier #include " /syscalnr h'' bufsiz = SECT TEXT I infbufst: I MOV BP,SP ! cinci MOV DI, linein ! PUSH GETCHAR ! : SYS! opt CMPB AL,'\n' I JL f Elf STOSB! JMP lb ! : APĂSĂ ! paisprezece PUSH line! cincisprezece IMPINGAȚI DESCHIS ' ! SYS' CMP AX, ! optsprezece JL f MOV (fildeș),AX ! douăzeci MOV SI,linh+ ! MOV BX, ! : Apelați fillbuf ! CMP CX, ! ZILE f ! : MOVBAL,'\n' ! REPNE SCASB! NElb' INC (număr) ! MOV AX,BX I SUB AX,CX ! XCHG SI,DI I STOS! XCHG SI,DI ! CMP CX, ! NE b! MP lb! : MOV SP,BP ! PUSH line! PUSH mesaj! PUSH PRINTF SYS PUSH EXIT I PUSH EXIT ! SYS! : Apelați getnum ! CMP AX, ! JLE f ! MOV BX,(curlin) ! CMP BX, ! cincizeci ZILE f ! CMP BX,(număr) I ZIG f I nr Lista B (continuare) SHL BX, MOV AX, linh- (BX) MOV CX,linh(BX) ! împinge ! IMPINGAȚI IMPINGE SEORUL! PUSH (fildeș) ! PUSH LSEEK I SYS SUB CX,AX ' PUSH CX! PUSH buff! PUSH (fildeș) ! PUSH READ I SYS! ADAUGĂ SP, ! IMPINGAȚI ! PUSH WRITE SYS' ADAUGĂ SP, ! JMP b! : PUSH scaner! PUSH PRINTF ! SYS! ADAUGĂ SP, ! MP b! : IMPINGAȚI ! PUSH EXIT ! SYS! fillbuf: ! Îmbunătății de PUSH! PUSH buf PUSH (fildeș) PUSH READ ! SYS! ADDSP, ! MOV CX,AX! ADAUGĂ BX,CX! MOV DI,buf ' RET! getnum: ! MOV DI, linein ! PUSH GETCHAR ' : SYS! CMPB AL,'\n' ÎL b ! J E Dacă! STOSB! MPlb! : MOVB (DI),' ' PUSH curlin PUSH numfmt ! PUSH line! PUSH SSCANF SYS ADAUGĂ SP, RET I I eu eu SECT DATE ! greșeală • ASCIZ „Deschiderea %s a eșuat\n” I numfmt: ASCIZ "%d" ! scaner • ! ASCIZ „Tastați un număr \n” ALIGN ! SECT BSS! linein: SPAȚIU ! câmpuri: SPACE ! linh: SPAȚIU curlin: SPACE ! buf: SPACE bufsiz+ ! count: SPACE ! Primele cinci linii de cod definesc numerele de apel de sistem și dimensiunea bufferului și setează indicatorul de bază în partea de sus a stivei, ca de obicei Rândurile - citesc numele fișierului de la intrarea standard și îl stochează pe un șir de caractere etichetat linein Dacă numele fișierului nu este închis de o linie nouă, este afișat un mesaj de eroare și procesul se termină cu o stare diferită de zero Toate aceste acțiuni sunt reflectate în rândurile - Observați că adresa numelui fișierului este împinsă în stiva pe linia , iar adresa mesajului de eroare este împinsă pe linia Mesajul de eroare în sine (reprezentat pe linia ) este o solicitare pentru șirul $s în format printf Tot aici este introdus și conținutul linein În cazul copierii cu succes a numelui fișierului, acesta este deschis în rândurile - Dacă apelul deschis eșuează, valoarea returnată devine negativă și sare la eticheta pe linia pentru a afișa mesajul de eroare Acest mâner va fi necesar la apelurile ulterioare de citire și Iseek Apoi, fișierul este citit în blocuri de octeți, fiecare dintre acestea fiind stocat în buffer-ul De fapt, tamponului i se alocă doi octeți de dimensiunea necesară ( octeți), dar acest lucru se face doar pentru a arăta cum o constantă simbolică și un număr întreg pot fi plasate într-o expresie (linia ) În mod similar, în linia , adresa următorului element al matricei linh este încărcată în registrul SI, ca urmare, un cuvânt de mașină cu valoare zero rămâne în partea de jos a matricei Registrul BX primește adresa de fișier a primului caracter necitit din fișier, ceea ce înseamnă că este inițializat la zero pe linia înainte ca tamponul să fie prima umplut Subrutina fillbuf, situată pe liniile - , este responsabilă pentru umplerea bufferului După ce argumentele de citit sunt introduse în stivă, se face o cerere de apel de sistem care plasează numărul de caractere citite efectiv în registrul AX Acest număr este copiat în CX, iar ulterior, după valoarea acestui registru, puteți va afla numărul de caractere rămase în buffer Poziția fișierului primului caracter necitit este stocată în registrul BX, iar pe linia valoarea CX este adăugată la valoarea BX Linia plasează partea de jos a tamponului în DI; pregătindu-se astfel să scaneze tamponul pentru următorul caracter newline După returnarea fillbuf, linia verifică dacă au fost citite cu adevărat caractere Dacă răspunsul este nu, bucla de citire tamponată trece la a doua parte a programului de pe linia După aceea, începe navigarea în buffer Caracterul \n este încărcat în registrul AL de pe linia , iar pe linia următoare, această valoare este căutată în bucla REP SCASB și comparată cu caracterele din buffer Ieșirea din buclă poate avea loc în două cazuri: când valoarea din registrul CX este zero sau când caracterul căutat este un caracter newline Cu indicatorul zero setat, ultimul caracter scanat este \n, iar poziția fișierului caracterului curent (situat după linia nouă) este stocată în matricea linh În continuare, contorul este incrementat, iar poziția în fișier este determinată de valoarea lui BX și de numărul de caractere rămase în CX (liniile - ale codului) Liniile - stochează, dar deoarece adresa țintă pentru instrucțiunea STOS nu este registrul SI, ci registrul DI, aceste registre sunt schimbate înainte și după apelarea instrucțiunii STOS În rândurile - se verifică datele rămase în buffer, după care, în funcție de valoarea lui CX, se efectuează o tranziție Ajunși la finalul dosarului avem la dispoziție o listă completă a pozițiilor din dosarul elementelor inițiale ale rândurilor Deoarece tabloul linh începe la cuvântul zero, știm că primul rând începe la adresa , următorul rând este la poziția linh + și așa mai departe Mărimea șirului n poate fi calculată scăzând adresa de pornire a șirului n de la adresa de pornire a șirului n + unu Restul programului citește numărul șirului de caractere, trece acel șir în buffer și apoi îl imprimă cu apelul de scriere Toate datele necesare pentru a efectua aceste operații se află în matricea linh, unde fiecare a n-a intrare conține poziția de pornire a liniei n din fișier Dacă dimensiunea șirului de caractere solicitat este zero sau în afara intervalului, programul se încheie prin sărirea la eticheta Această parte a programului începe cu un apel către subrutina getnum (linia a codului) Citește un șir de caractere de la intrarea standard și îl stochează în buffer-ul linein (liniile - ale codului) În continuare, apelul SSCANF este pregătit Având în vedere ordinea inversă a argumentelor, adresa buffer-ului curlin este împinsă mai întâi pe stivă, unde poate fi plasată o valoare întreagă, apoi adresa șirului de format pentru reprezentarea întregului numfmt și, în final, adresa buffer-ului linein , care conține numărul în reprezentare zecimală Dacă este posibil, rutina sistemului SSCANF pune valoarea binară în curlin În caz de eroare, returnează valoarea zero AX Verificarea valorii returnate se face pe linia ; în caz de eroare, programul generează un mesaj de eroare prin indicatorul Dacă rutina getnum returnează o valoare întreagă validă în curlin, aceasta este mai întâi copiată în BX Această valoare este apoi verificată Exemple subiectul apartenenței la intervalul admis (rândurile - din cod) eu se constată că dimensiunea rândului este în afara acestui interval, programul se iese (EXIT) Apoi, trebuie să determinați poziția finală a acestei linii în fișier și numărul de fișiere care trebuie citite; în acest scop, valoarea BX este înmulțită cu deplasarea la stânga (SHL) Pe linia , poziția caracterului de linie curent din fișier este copiată în registrul AX Apoi poziția următorului șir de caractere este plasată în registrul CX și numărul de biciclete din șirul curent este calculat din acesta Iseek este folosit pentru a citi aleatoriu date dintr-un fișier; o setează offset-ul la octetul care ar trebui să fie citit în următoarea coadă Subrutina Iseek este executată relativ la începutul fișierului și, ca atare, argumentul zero este împins în stiva de pe linia Următorul argument pentru roi este offset-ul din fișier Prin definiție, acest argument este un întreg lung ( de biți), astfel încât cuvântul nul este împins mai întâi în stivă, urmat de valoarea lui AX (liniile și ale codului); în acest fel se formează o valoare întreagă nos cis pe de biți Apoi, pe linia , descriptorul de fișier și codul LSEEK sunt împinse în stivă și apelul este efectuat Valoarea returnată LSEEK determină* poziția curentă în fișier și o puteți găsi în combinația de registre DX : AX ; prin urmare, dacă scădem valoarea acestui registru din CX (linia ), obținem numărul de octeți care trebuie citiți pentru a plasa linia în buffer Orice altceva este foarte simplu Liniile - citesc o linie dintr-un fișier și apoi utilizați descriptorul de fișier de pe liniile - pentru a-l scrie la ieșirea standard Rețineți că, după curățarea parțială a stivei, care are loc pe linia , valorile contorului și buffer-ului rămân pe stivă În cele din urmă, pe linia , indicatorul stivei este complet resetat, urmat de salt înapoi la eticheta și un alt apel pentru a obține num MULȚUMIRI Asamblatorul la care ne referim în acest apendice face parte din setul de compilare Amsterdam Versiunea completă a acestui kit poate fi găsită la www cs vu nl/ack Suntem recunoscători oamenilor implicați în dezvoltarea sa originală: Johan Stevenson, Hans Schaminee și Hans de Vries Suntem profund datori lui Cyril Jacobs, care, în timp ce întreținea acest pachet software, l-a adaptat de mai multe ori la cererea noastră pentru uz educațional, și lui Elth Ogston, care a citit manuscrisul și a verificat exemplele și sarcinile În plus, am dori să mulțumim lui Robert van Renesse și lan-Mark Wams, dezvoltatori de trasoare pentru PDP- și, respectiv, Motorola - Multe dintre ideile lor au fost luate în considerare la dezvoltarea trasorului nostru Desigur, cele mai calde cuvinte merită toți asistenții și operatorii noștri de sistem, care ne-au ajutat în predarea limbilor de asamblare de mulți ani Întrebări și sarcini Care sunt valorile registrelor AH și AL după executarea instrucțiunii MOV AX, ? Valoarea registrului CS este Care este intervalul de adrese de memorie absolută în acest segment de cod? Care este adresa maximă de memorie pe care o poate accesa Să presupunem că CS = , DS = și IP = ) Care este adresa absolută a următoarei comenzi? ) Ce cuvânt de memorie este încărcat în registrul AX când este executată instrucțiunea MOV AX ( )? Subrutina cu trei argumente întregi este apelată conform secvenței de apelare descrisă în această anexă — programul de apelare împinge argumentele în ordine inversă pe stivă și apoi execută instrucțiunea CALL Programul apelat salvează apoi valoarea anterioară a BP și introduce o nouă valoare care indică cea veche Apoi, indicatorul stivei este incrementat negativ; alocând astfel spațiu pentru plasarea variabilelor locale Având în vedere această secvență, denumește instrucțiunea necesară pentru a muta primul argument în registrul AX În fig B expresia de - hw acţionează ca un operand Această valoare exprimă diferența dintre cele două etichete Există o situație în care de + hw ar putea fi operandul real? Justificați răspunsul dvs Scrieți codul în limbaj de asamblare pentru a evalua următoarea expresie: = a + b + O anumită funcție C este numită după cum urmează: bara de picior(x,y); Scrieți codul limbajului de asamblare pentru a efectua acest apel Scrieți un program în limbaj de asamblare care ia ca intrare o expresie constând dintr-un număr întreg, un operator și un alt întreg și oferă valorile expresiilor respective ca ieșire Operatorii +, -, x și / sunt permisi Index alfabetic ȘI ACL Asogn Computer, ADSL, AGP, AMBA, APIC Apple Apple Newton ARM , ASCII, ASIC ASID, ATA, ATAPI, ATmegal , adresare, arhitectură de instrucțiuni, microarhitectură, set de instrucțiuni, , registru de stare, registre, tipuri de date, formate de instrucțiuni, , AVR AVX, Air Force Micro, de ani BGA- BIOS, Blue Gene/L, Blu-ray, BSS, Burroughs-B , c Catamount CCD- CC-NUMA, , CDC , , , CD-R, CD-ROM, CD-ROM XA, CD-RW, Celeron CISC, CMYK, COLOSUL COMA, , Core duo, Core Connect, coge i adresare, memorie virtuală, pipeline, - microarhitectură, , mod real, registre, modul procesor virtual , Vaca, CRR, , CRC, , DDR, DEC, , D MM, D P, DLL, DMA, DM , , dpi, DRAM, DSLAM, DSM, DSP, DVD, E ECC, EDO EDVAC, EEPROM, , EIDE EISA, ENIAC, ENIGMA, EPIC- EPROM, EPT P A T , F FO, FMS, FORTRAN FPGA, , , FPM, FPU, FSM- H lligh Sierra, html, HTTP, IA- , IA- , - IAS, IBM IBM , IBM , IBM , IBM , IBM , IBM , IBM , IDE, IFU, IJVM, set de instrucțiuni, stivă, calea datelor, ILC ILIAC, ILIAC IV, ILLIAC-IV, i-node, Intel Intel A, Intel- A, Intel Pentium IP, I P C ISA, , ISP, , ISR Itanium , - G GDT- Google GridPad, GUI, , J Ioana, de ani La Kinect, controler, lan- Latină- , LBA, LDT- LGA, Linda, model de muncitor replicabil, pachet de locuri de muncă , spațiu tuplu, model , Linux Ірі, LRU, , LUT LV, , m mal, M A R MBR, MDR MESI MFT- Mic- , Mic- , Mic- , Mic- , Microsoft, Microsoft Xbox , MIMD, MINIX MIPS, , MIR, MISD MMU- MMX- Motiv, Motorola- , MPC- MPEG- MPI- MPP, , MTBF MULTICS, N NaN, NC-NUMA, NID, NORMA, ACUM, NTFS NUMA , NVIDIA NVIDIA Fermi O OCP-IP, OGSA OLED, OLE LINK, card de memorie, OLELINK, Furnizor de servicii Internet, OLE LINK, emițător, OLE LINK, gestionarea excepțiilor, OLE LINK, diametrul rețelei de comunicații, OLE LINK, sistem scalabil, OMAR , adresare, memorie virtuală, omega Omnibus, ORS, Opteron, Orca, operațiune, generarea unui nou proces, fuzibil, RS, , РІ, , PCIE, PCI Express, , , titlu, strat de legătură, index alfabetic Aspect PCI Express (continuare), de pachete, de încărcări utile, de straturi de software, de stive de protocoale, de control al fluxului, de straturi de tranzacție, de straturi fizice, PDA, PDP- , PDP- , Pentium , PGA RU, RnR, POSIX, PUTERE , PPE, PROM, PSW, , pthreads, RVM, RAID RAM, R A S RAW, Furtuna Roșie RFID, , RGB, RISC, , , R O B , ROM, s samsung galaxy Samsung Galaxy Tab Podul de nisip SCSI SDRAM, Seastar Serial ATA, SIB, , SID SIMD Procesor SIMD, SIMM, SISD, SLED, SLR SMP- SO-DIMM, Sony PlayStation- , SP- SPARC SRAM SSE TAT- / , TCP TFT, TLB, TLB Miss, TN, T O S , Trimedia, TX- , UART, UMA Unicode UNIX Berkeley Sistemul V, biblioteca principală, canalul , flux de programe, biblioteca țintă, USART USB, USB , UTF- i-conveior, V VAX, , VCI, VLIW VMCS VMX, VTOS, ѵ-conveior, W WAN RĂZBOIUL WAW, WEIZAC Vârtej Wiimote, controler, API Win , Win Windows Windows , Windows , Windows , Windows ME Windows NT X X T, Xion X Windows Zilog Z , canal de abonat, cale absolută, mod auto-decrementare, mod auto-incrementare, informații autonome, inversare aditivă, adresare, , index, registru index, ad|m*sation (continuare) registru index|X)iii cu offset, instrucțiuni de salt, registru indirect, , imediat, , , implicit, indice relativ, direct, registru, registru co offset, moduri, stivuite, spațiu de adrese, virtual, fizic, registru de adrese, adresă de memorie, , reale, liniară, Aiken Howard, , acumulator, , standby activ, indicator matrice activă, algebră boolean, circuite de relee, algoritm, ALU, , , , Legea Amdala, modulație de amplitudine, motor analitic, memorie partajată distribuită hardware, hardware, de arbitraj de magistrală, de arbitri de magistrală, de argumente, aritmetică cu saturație, unitate logică aritmetică, , , , arhitectură, , harvard, încărcare și salvare, computer, superscalar, linie digitală asimetrică de abonat, magistrală asincronă, , asamblator, , , , a doua trecere, generare de cod, etichetă globală, interpret, legare, etichetă locală, mnemonic, , prima trecere, pseudo-instrucțiune, secțiune BSS, date, text, nume simbolic, tabel cu nume simbolice, puncte, trasor, directivă de asamblare, program de asamblare, memorie asociativă, , John Atanasov, baza, sistem de bază I/O, unitate de bază, registru de bază, filtru Bayer, octeți prefix, , termen, , tip de date, banca, Banzi Massimo, Bardeen John, rețea de bariere, stație de lucru fără cap, bibliotecă legături dinamice, importuri, acces multiplu, operațiuni binare, căutare binară, biți, , otrăvire, , prezență, paritate, bitmap, bitmap, lângă apel, lângă salt, bloc de bază, preluări de comandă, apeluri de comandă, dubla adresare indirectă decodare, adresare indirectă, recurgere, alocare și înlocuire, triplă adresare indirectă, coadă, blocare rețea, Bogen Alf-Egil, baud, model de memorie mare, firewall, Brattain Walter, Boolean alge, Boolean alge George, buffer conversie rapidă, , preîncărcare, apel, obiecte de tranziție, de reordonare a comenzilor, de transmitere a mesajelor în tampon, registru tampon de memorie, element tampon fără inversare, cu inversare, modul rapid pagină, Charles Babbage, în intrare ieșire programabil, memorie mapată, acces direct la memorie, cu control întrerupere, procesor vectorial, registru vectorial, vector de întrerupere, , poarta, , , interacțiunea componentelor periferice, , interdependenţă RAW, RĂZBOIUL WAW, memorie video, Winchester, virtualizare, mașină virtuală, , organizare virtuală, memorie virtuală, Coge I , OMAR , rutare virtuală end-to-end, topologie virtuală, spațiu de adrese virtuale canal virtual, registru virtual, caracter extern, link extern, fragmentare externă, fragmentare internă, multithreading intraprocesor, Wozniak Steve, de ani Vollan Vegard, de ani octal, valoare octală, locație de timp, interval de timp, timp întârzieri, MTBF, timp (n[mm)olzhenig) sectorul așteaptă, legături, ceasuri, computerizare generalizată, asamblator de a doua trecere, procesare de intrare, limbaj de intrare, preluare, pagini alocate, apeluri mijloc, departe, sistem , , pagini la cerere, supraveghetori, justificare dreapta, procesare ieșire, limbaj de ieșire, calcul cu paralelism explicit al instrucțiunilor, centru de calculatoare, arhitectura harvard, generare de cod, hypervisor, hypercube, hyperthreading, , bibliotecă principală, tabel principal de fișiere, etichetă globală, rețea globală, tabel global de descriptori, curse, gradație semiton, GUI, , grup de registre de segmente, Gutenberg Johann, apel interurban, trecere pe distanță lungă, Dump RAM, Index alfabetic dublare, dublu, dublu întreg, dublu torus, program binar, sistem de numere binar, BCD, BCD, traducător în două treceri, adresă reală, decodor, De Morgan, demultiplexer, demultiplexer , descriptor securitate, index , fișiere, , zecimală, Steve Jobs, George Stibbits, codificare de fază de de dibiți, legătură dinamică, RAM dinamică, scalare dinamică a tensiunii, predicție dinamică a ramurilor, disc, optic, discuri SSD, dispecer memorie, expediere, afișaj OLED, TFT, LCD, CRT, Twisted Nematic, Lungime cale, Cuvânt lung, Număr întreg lung, Complement până la două, până la unu, piesa, , acces la memorie neregulat, , neregulat, doar cache, , copil, șofer de autobuz, duplicarea resurselor, duplex link, duplex modem, E unități, , ȘI carte galbenă, hard disk-uri, hard resource sharing, display cu cristale lichide, antet PCI Express, TCP, sofer autobuz, intarziere supapa, lege Amdala, Moore, legea lui Moore, închidere, CD-uri de înregistrare, înregistrări infix, invers, revers polonez, single, întârziat, , perpendicular, după scriere, după citire, postfix, prin, , umplere la scriere, memorie , declanșare margini, nivel de semnal , pagină rezervată , capturare ciclului memorie , , blocare D S R , sincron, , stea, Cartea verde, prelungire semnată, parte semnificativă a numărului, valoarea octal, zecimal, hex, dinte de vampir, Zus Konrad, Și computer pentru jocuri, , ID de securitate, ierarhia memoriei, ieșire inversă, invertor, index sursa, receptor, fișier, culoare indexată, indexate, registru, registru offset, inode, registru index, indicator activ, pasiv, circuit integrat, aplicații computerizate, extra mari, interval intersectorial, Hamming, de interpreți, , , de interpretări, de interfețe sisteme de calcul mici, mesagerie, controler gazdă deschis, universal, îmbunătățit, înregistrare infix, secțiune informativă, registru de informații, informații autonom, operațional, ecran tactil cu infraroșu, circuite integrate, excepții, execuţie cu schimbarea secvenței, speculativ, executabil binar, executabil binar, executabil binar, limba sursă, operand sursă, La Internet prin cablu, modem prin cablu - , cadru variabile locale, , calibrare, canal, , strat de legătură, computer de buzunar, catalog, rădăcină, curent, confirmare finalizată, Kilby Jack, Keel i-a dat lui Gary, de ani tastatură, cluster, stații de lucru, sisteme de fișiere, computere cluster, clone, taste, carte galben, verde, roșu, portocaliu, coerența cache, Codul BCD, corecții de erori, operații, Reed-Solomon, simboluri, auxiliare, condiții, Hamming, Codare pe / biți, pagini de coduri, cuvinte de cod, puncte de cod, segment de cod, colector, tampon de apel, de apel, comandă I/O, preluare, decodare, executare, mutare, comparare, ramură condiționată, circuit combinatoriu, comunicator, rețea de comunicații, diametru, factor de ramificare, dimensiune , grad de nod , nod de comutare, Reținerea pachetelor și comutarea directă, CD, inscriptibil, multisession, inscriptibil, sector, frame, comparator, compilator, , layout dinamic, implicit, explicit, linker, , linker loader, computer jocuri, , buzunar, cluster, mobil, invizibil, , acțiune paralelă, personal, cu set de instrucțiuni complet, , cu set de instrucțiuni redus, , arhitectura calculatoarelor, organizarea calculatoarelor, calculatoare tableta, transportor, Pentium simplu, model transportor, mașină de stat, tranziție, stat, constantă de realocare, controler intrare-ieșire, disc, secvențe, întreruperi, punct de control, concentrator de munte, copy-on-write, director rădăcină, hub rădăcină, locuință cu două capete, tuplu, registru indirect, , Rata de lovituri în cache, rateuri de cache, furci, carte roșie, Cray Seymour, secțiune critică, multithreading grosier, Cuartillier David, cuburi, blocuri cache, micro-ops, servo, consistență, cache invalidarea datelor, strategie de actualizare, cache, , , p-input asociativ, al doilea nivel, completare la scriere, cache hit, cache miss, writeback, pooled, write-back, afișare directă, împărțit, , scris, L Lovelace Ada, de ani imprimantă laser, valoare din stânga, adresa bloc liniar, FROM adresa liniară, link abonat, duplex, simplex, literal, logici negativ, pozitiv, intrare logică, locație temporară, spațială, etichetă locală, rețea locală, tabel de descriptor local, găuri, disc magnetic, arhitectură macro , apel macro , definiție macro , extindere macro , macro , sistem de operare, parametri reali, parametri formali, model de memorie mică, mantisa, jeton de acces, , router, rutare virtual, de la la masca în operațiuni binare, Masuoka Fujio, scalabilitate, multicomputer scalabil, placa de baza, Index Mașina analitic, virtual, diferență, von Neumann, , limbaj mașină, , interval intersectorial, protocol gateway, multithreading cu granulație fină, etichetă, global, local, metoda, microasamblare, microdisc, microinstrucțiuni microcontroler, , micro-operare, microprogram, , , microprogramare, cip, RFID, procesor, model de memorie în miniatură, mini sloturi, Myhrvold Nathan, mnemonice, , partiționare imaginară, multitasking, multithreading în procesor, cu granulație grosieră, cu granulație fină, sincron, CD cu mai multe sesiuni, organizare computeră pe mai multe niveluri, calculator mobil, model memorie mari, mici, în miniatură, viabile, lucrători replicați, modem ADSL, duplex, cablu, half duplex, modul obiect, memorie cu două capete, cu pinout pe o singură față, modulație, amplitudine, fază, frecvență, montaj OR, MOP, Moshley John, de ani multicomputer categorii, scalabil, definiții, , magistrală multiplex, multiplexer, multiprocesor, , , bazat pe catalog, simetric, multitouch, Moore Gordon, , de ani șoarece, mutex, mainframe, n transmiterea mesajului neblocant, retea neblocante, computer invizibil, , logica negativa, numar nenormalizat, acces neuniform la memorie, , adresare directă, , , Index alfabetic •OS operand imediat, dosar imediat, semnal purtător, nu un număr, adresare implicită, legarea implicită, nivelarea uzurii, Noyce Robert, , număr normalizat, secțiune statutară, zona procedurii, tehnologii cloud, coajă, tratament intrare, vacanță, semitonuri, manipulator întrerupe, semnale digitale, rescriere, Notație inversă poloneză, compatibil cu inversarea, Little Endian, , cache unificat, program obiect , modul obiect , , fișier obiect, suprapunere, cuprins pe disc, limită de putere , flux de instrucțiuni unic cu multiple fluxuri de date, scrie o singură dată, secțiuni de un singur bit, accesuri uniforme la memorie, RAM, rotunjire, octet, Olsen Kenneth, de ani operand original, operand (continuare) imediat, țintă, informații operaționale, RAM, dinamic, static, sistem de operare, , operare, , binar, unar, descriptor, sondaj, potrivire optimă, discuri optice, cărți portocalii, baza sistemului de numere, arhitectura deschisă a serviciilor de calcul distribuite, interfață deschisă a controlerului gazdă, colector deschis, write-back, , adresare index relativ, eroare relativă, cale relativă , coadă de mesaje , eroare Lipsește pagină, depășiri, depășiri, P pachet, , , antet, de locuri de muncă, de recunoașteri, de încărcări utile, modul lot, memorie, , asociative, , virtuale, actualizare, operaționale, Index alfabetic nume (continuare) permanent, atrăgător, stratificat, cu opțiuni avansate de ieșire, manager, memorie flash, paralelism la nivel de echipă, la nivel de procesor, de mașini virtuale paralele, I/O paralel, parametru actual, formală, Pascal Blaise, indicator de matrice pasivă, Patterson David, DAP, prima trecere a asamblatorului, trecere de mesaje tamponat, neblocant, sincron, CD-reinscriptibil, conexiune încrucișată, suprapunere de segmente, redirecționare încărcare, captură excepție, salt mijloc, îndepărtat, mașină de stat, timeout, magistrală periferică, înregistrare perpendiculară, computer personal, asistent electronic personal, ROM, pixeli, puncte flotante, tablete, tampoane, computerizare omniprezentă, înlocuire de registre, subrutine, , autobuze sclave, ascensoare, logica pozitiva, pozitionare, program independent de pozitie, defalcare celule, sarcină utilă, politică de completare a scrierii, interconectare completă, amestecare completă, recunoaștere deplină, partajare completă a resurselor, poartă completă, sumător complet, bandă, nibble, modem semi-duplex, jumătate adunator, mod utilizator, partajare a resurselor de prag, generarea unui nou proces, reverse endian, , drept, interogare în serie, memorie non-volatilă, CD-ROM, programabil, șters, reprogramabil electronic, intrare postfix, flux I/O, date, comenzi, program, , controale, consumator, preambul, comanda predicat, predicție, întrerupere, inexact, precis, prefix, prefix bytes, , utilizator privilegiat, mod privilegiat, bus sink, transceiver și la OLE LINK, generic asincron, universal sincron-asincron, anvelope, programator de aplicații, interfață de programare a aplicațiilor, imprimantă, laser, cu cerneală de ceară, cerneală solidă, jet, termografic, principiu RISC localitate, , atragerea memoriei, problema link extern, realocare memorie, consistența cache, thrashing, predicție de ramuri, dinamic, static, program, binar, executabil, în limbaj de asamblare, manipulare întrerupere, , obiect, independent de poziție, automodificabil, matrice de porți programabilă în câmp, ro i ram m și memorie nevolatilă ruiabilă, comunicații programabile, I/O programabile, controler de întrerupere programabil, programator aplicat, sistemic, software, flux de programe, , nivel de program, ecran tactil capacitiv proiectat, transparență, producător, prolog proceduri, debit procesor, secțiune, agregat, mediu, schemă COMA simplă, simplă, , localizare spațială, spațiu adresa, tupluri, protocol, , internetwork, scriere o dată, write-back, transfer hipertext, negociere cache, control transfer, magistrală, trecere de asamblare, procedura , proces , copil, părinte, Procesor SIMD vector, rețea, Index alfabetic procesor (continuare) masiv paralel, , cuvânt de control extra-lung, central, consistența procesorului, adresare directă, acces direct la memorie, , big endian, pseudo instrucțiuni, , , cale, absolut, relativ, pachet, R set de lucru, capitol informativ, normativ, partajare dificilă a resurselor, complet, prag, cache partajată, , dimensiune rețea de comunicații, motor de diferențe, alocare de de discuri, memorie partajată distribuită, , arhitectură de servicii de calcul distribuite, organizare virtuală, definiție, nivel infrastructură, echipe, aplicații, resurse, memorie stratificată, oblic, autobuz oblic, extensie opcode, arhitectură standard industrială extinsă, interdependență reală, moduri reale, registre, , , bază, vector, virtual, index, coduri de condiție, instrucțiuni, microinstrucțiuni, scop general, memorii adresa, buffer, date, sumator, contor, pointer, flag, , adresare registru, adresare registru offset, linker, mod auto-decrementare, auto-incrementare, adresare, paginare rapidă, vcpu, lot, utilizator, privilegiat, real, ecran tactil rezistiv, procedură recursivă recursivitate, latice, risc, procesul-mamă, program de auto-modificare VLSI, resetarea semnalului, Ukamtvl alfabetic LSI, LED, Free Consistency, Free Page, Link, registrul de deplasare al dinamicii tranziției Dov, segment, , date, suplimentar, layout-uri, segment de index, consistență secvențială, secvență Carlo, sector, secțiune BSS, date, text, semafor, ecran tactil, server, sesiune, dispozitiv de interfață de rețea, procesor de rețea, grilă, reţea barieră, blocare, globală, comunicare, locală, neblocare, stație de lucru, mai multe etape, semnal rulment, resetare, management, instalare, procesoare cuplate strâns, nume simbolice, multiprocesoare simetrice, legături simplex, D-latch-uri sincrone, Buton SR sincron, DRAM sincron, multistream sincron, mesagerie sincronă, magistrală sincronă, , transceiver sincron-asincron, sistem scalabil, operațiuni, de sondare secvențială, de partajare a timpului, de memorie partajată, de memorie partajată, de calcul octal, binar, hexazecimal, sistem de autotuning prin întârziere, magistrală de sistem, apel de sistem , , programator de sistem, scris, , nematic răsucit, consistență slabă, procesoare cuplate slab, cache-uri martori, urmărire, cuvânt, , cod, stări program, , slot întârzieri, serviciul de informare generală și informatică, smartphone, offset, eveniment, debitul total abilitate, consistență cache, socket, corutine, coprocesoare, Index alfabetic co-dezvoltare, stare curse, computer, mașină de stat, consistență procesor, gratuit, secvenţial, slab, strict, descărcare speculativă, execuție speculativă, ASIC, listă control acces, memorie liberă, despicator, debit mediu, link forward, eroare standard, standard industrial arhitectura, intrare standard, ieșire standard, RAM statică, predicție statică tranziții, grămadă operanzi, , , variabile de procedură, de adrese de stivă, de cadru de stivă, de grade de nod, Stibbits George, de ștergere programabile memorie permanentă, pagina, dedicat, rezervat, gratuit, memorie de paginare, cadru de pagini, scaner de pagini, strategie actualizări, invalidarea datelor, poarta, consistență strictă, linia cache, , , memorie principală, jet de cerneală, cu bule, piezoelectrice, termice, iluminat structurat, trepte transportoare, sublimare, sumator, plin, jumătate sumator, carry-select, carry-through, supercomputer, , arhitectură superscalară, , circuit integral, combinatoriu, schimburi, tejghea adrese, adrese de instrucțiuni, instrucțiuni, , , firmware, accesări, masa vectori de întrerupere, fișier principal, descriptori global, local, expedieri, adevăruri, cuprins, tabel (continuare) plasarea fișierelor de nume simbolice, , , pagini, , generator de ceas, unități SSD, director curent, terminal, imprimante termice, termoreglare, tipuri de date octet, zecimală codificată binar, cuvânt lung, nenumerice, cuvânt, numeric, jeton, arbore gras, tranzistor cu peliculă subțire, topologie, , Torvalds Linus, de puncte intrare, control, salvare, tract, cale de date, , , tranzistori, bipolar, MOP, TTL, ESL, transceiver autobuz, translator, broadcast, tracer, trigger, TTL Wilkes Maurice, de puncte, baze, recorduri, indicatoare (continuare) cadru, comenzi, , stivă, citiri, operare unară, magistrală serial universală, transceiver asincron universal, interfață universală controler gazdă, control flux, control memorie, prefetch, nivele, abstracții hardware, arhitecturi seturi de instrucțiuni, , , asamblatori, infrastructuri, canale, colective, microarhitecturi, , , microprogramari, sisteme de operare, , , aplicații software, tranzacții, fizice, dispozitive fizice, , logică digitală, , port grafic accelerat, variabile de condiție, execuție condiționată, interfață îmbunătățită controler gazdă, controler îmbunătățit întreruperi, semnal setat, date învechite, dispozitiv aritmetic-logic, , intrare-ieșire, memorie, dispozitiv (continuare) interfață de rețea, cuplat la sarcină, cu controler integrat, tri-state, anvelope maestru, subordonat, modulare de fază, dosar, executabil, imediat, obiect, sistem de fișiere FAT, NT, parametru real, Steve Farber, strat fizic, spațiu de adresă fizică, filtru Bayer, de ani optic, software, steag direcții, transfer de servicii, paritate, registru steag, , Clasificare Flynn, dischete, memorie flash, von Neumann John, computer von Neumann, , parametru formal, fragmentare extern, intern, Freeman Ross, de ani, X butuc, Hamming Richard, de ani Turnul din Hanoi, , hashing, Hoagland Al, Hawkins Jeff, de ani c paletă de culori, scale de culori, biblioteci țintă, operanzi țintă, limbi țintă, întreg dublu, lung, cpu, , data center, ciclu preluare-decodare-executare, calea datelor, anvelope, eficient, verificare de redundanță ciclică, , cilindru, linie digitală de abonat, cameră digitală, , nivel logic digital, , pinout, CPU, h decodificare parțială a adresei, FSK, FSK, cerneală pe bază de colorant, pe bază de pigment, număr precizie finită, nenormalizat, normalizat, semnat, dublu, citit după scriere, model, sistem de numere hexazecimale, valoare hex, autobuz, , , , AGP, PCI, semnale, tranzacții, USB, asincron, , , multiplex, periferic, protocol, procesor, registre dispozitiv, sincron, , sistem, lățime magistrală, serviciu de criptare în bandă largă, cu cheie publică, cheie simetrică, gateway de apel , Shockley William, de ani Pantofi Garth Howard, uh echivalența circuitului, Eckert J Presner, expozant, tub catodic, EPROM, CRT, Epilogul procedurii, ESL, Estridge Filin, ciclu efectiv, EU SUNT legătură explicită, miez, limba asamblator, , , intrare, mare, ieșire, sursă, mașină, , țintă, celula de memorie, 